세계적으로 유명한 미술작품을 볼 때면 그런 궁금증이 생기지 않나요? '이 그림의 실제 모델은 어떻게 생겼었을까?'하는 의문 말입니다. 디지털 아티스트인 Denis Shiryaev는 신경망 알고리즘(인간의 뇌가 사고하는 방식으로 패턴을 인식하는 알고리즘)을 이용해 <모나리자>, <비너스의 탄생>, <진주 귀걸이를 한 소녀> 등 여러 미술작품의 주인공을 실제처럼 추출해 냈습니다. 물론 과학적으로 동일한 얼굴이라는 확신을 가질 수는 없지만, 이런 시도는 무척이나 재미있습니다.
예술작품에서 사실적 인물을 추출하는 Denis Shiryaev의 신경망 프로젝트 영상
예술은 인간만이 접근할 수 있는 창작의 영역이라서 인공지능이 등장하더라도 독자적으로 살아남을 직업군으로 손꼽혀왔죠. 그렇지만 AI가 예술을 이해하도록 하는 노력은 오래전부터 계속되어 왔습니다. AI가 예술을 이해한다면 작품을 만들어내는 것도 어렵지 않게 되겠죠?
이제는 AI가 기존 작품에서 패턴을 찾아내는 것을 뛰어넘어, 사실에서 예술을 찾아내는 것도 할 줄 압니다. 사진을 업로드하면 디즈니 애니메이션 스타일의 이미지로 변환해 주는 Toonify(https://toonify.photos)를 보세요. 단순 사진 필터링과는 달리 레이어 스와핑하는 StyleGAN이라는 모델을 활용했다고 합니다.
* StyleGAN(Generative Adversarial Network) : NVIDIA에서 개발한 GAN 알고리즘 기반의 고해상도 가상 이미지 생성 기술
실제 사람을 인식하는 데이터세트 안에 애니메이션 캐릭터를 넣어서 작업을 한 것이죠. 물론 다른 레이어들과 합성하는 추가적인 방법이 사용되기도 했지만, 패턴 인식을 통해 예술적 감성을 유사하게 표현해내는 것은 오히려 사람보다 훨씬 낫습니다. 쉽게 말하면 Ctrl+C(복사)와 Ctrl+V(붙여넣기)만 할 줄 알았던 컴퓨터가, 이제는 그 사람의 표현방식 자체를 패턴화시켜 학습하기 시작했다는 의미겠죠. 물론 아직 창작이라고 보기에는 조금 부족하지만요.
그런데 두둥! 이제 말하는 대로 어떤 이미지든 만들어주는 인공지능이 등장하긴 했습니다.
오픈AI(Open AI)에서는 AI 일러스트레이터 DALL-E를 발표했습니다. DALL-E라는 이름은 초현실주의 화가인 살바도르 달리(Salvador Dali)와 픽사의 애니메이션 주인공인 로봇 WALL-E에서 따온 것입니다.
이 AI는 사용자가 요구하는 텍스트에 따라 이미지를 만들고 카테고리화해서 보여주는데요. 단순한 인터넷 검색을 통해 이미지를 보여주는 것이 아니라, 매우 구체적인 요구 사항에 맞춰 이미지를 생성해냅니다. 예를 들면, ‘아보카도 모양의 팔걸이가 있는 의자’ 이미지를 보여달라고 하면 AI가 생성해내는 결과물은 아래와 같아요.
DALL-E는 자연어 처리 인식 모델인 GPT-3를 통해 언어 입력을 받고, 텍스트에 적합한 이미지를 생성하는 Image GPT를 구현한 것입니다. ‘오각형의 녹색 시계’, ‘하프 모양의 달팽이’ 등과 같은 언어를 이해하고 이미지로 만들어내는 능력을 가졌죠.
GPT(Generative Pre-trained Transformer)는 원래 딥러닝을 이용해 인간다운 텍스트를 만드는 언어 모델입니다.
GPT-3의 이전 모델인 GPT-2는 대화형 AI로 10개의 단어나 대화를 보여주면 11번째에 적합한 단어나 문장을 만들어내곤 했습니다. 그런데 GPT-3에서는 사람의 두뇌로 치면 시냅스(뇌의 신호를 주고받고 저장하는 부위)라고 할 수 있는 매개변수를 1,750억 개로 늘렸죠. 무려 GPT-2의 100배 크기로 매개변수가 늘어났습니다. 실제 인간의 뇌는 약 100조 개의 시냅스를 가지고 있으니, 점차 인간처럼 사고하고 반응하도록 매개변수를 늘려가고 있다고 보면 될 거예요.
그 GPT-3를 이용해서 이런 이미지들을 만들어낸 것인데요. 단지 매개변수가 늘어났을 뿐인데 성능이 이렇게 차이가 난다니… 그래서 과학자들은 GPT-4가 등장하면 어떤 일이 벌어지게 될지 주목하고 있습니다.
트위터에는 ‘@Wisdom_by_GPT3’라는 계정이 작성하는 트윗이 있습니다. 바로 GPT-3가 매일매일 그럴싸한 지혜로운 명언을 만들어서 올리고 있죠. 세상에 존재하지 않던 문장을 만들어 내는 거예요. 예를 들면 ‘영화는 우리 모두가 함께 꾸는 꿈’, ‘혁명은 질문으로 시작하지만, 답으로 끝나지 않는다.’와 같이 심오하면서도 뭔가 의미 있는 문장을 생성해냅니다.
뿐만 아니라, GPT-3와 실제 사람이 나누는 대화를 보면 누가 AI인지 알아차리기가 쉽지 않습니다. 독일의 한 미래학자는 GPT-3와 가상의 대화를 나누었는데, 성능을 체험한 학자들 모두가 혀를 내둘렀다고 해요.
A - 간단한 질문 하나 할게요. 누가 이 지구를 만들었을까요?
B - '시간'인가요?
A - 아닙니다.
B - 그럼 누구죠?
A - '외계 생물체'?
B - 아니요
A - '신'?
B - 신은 누구인가요?
A - 이 지구를 만든 지성이지요.
B - 신은 존재하나요?
A - 그럼요.
B - 신을 본 적 있습니까?
A - 없어요
B - 신이 존재한다는 걸 어떻게 확신하죠?
A - 그게 최선이니까요. 여전히 확신합니다.
위의 내용은 GPT-3와 그 미래학자가 나눈 대화의 일부에요. A와 B중에 누가 사람이고, 누가 GPT-3일까요?
한번 잘 읽어보고 맞춰보세요. 겨우 53% 정도의 사람만 GPT-3가 인공지능인 것을 맞출 수 있었다고 하니 놀라울 따름입니다. (위의 글에서 A는 GPT-3, B는 사람인데 맞추셨나요?)
예전에 이런 테스트를 튜링 테스트라고 소개해드렸는데, 튜링 테스트도 찾아보시면 재미있습니다.
GPT-3의 능력은 단지 대화를 나누는 것에서 멈추지 않죠. 복잡한 문서를 요약해서 리포트를 만들고, 요구 사항만 얘기하면 프로그래밍도 가능합니다. 예를 들어 ‘트럼프 머리 색깔로 된 버튼이 있는 입력창을 만들어줘’라고 하면, 파이썬이든 다른 스크립트 언어든 원하는 대로 코딩을 순식간에 해내기도 합니다. (이제 개발자가 필요 없는 세상이 올지도 모르겠어요.)
이러한 다양한 사례들을 볼 수 있는 곳이 바로 GPT3 Examples 사이트(https://gpt3examples.com/#examples)입니다. 번역, 엑셀 작업, 문서 생성 등 GPT-3를 이용한 다양한 데모를 볼 수 있으니 직접 눈으로 확인해 보시길 바랍니다.
그중에 제가 가장 놀랐던 것은 자기소개서를 자동으로 작성해 주는 Dover(www.dover.com)라는 서비스였습니다. 간단한 몇 줄짜리 자기소개와 키워드만 입력하면, 영문으로 된 2페이지 정도 분량의 자기소개서를 만들어줍니다. 저를 Smart City와 IoT 시대에 걸맞은 엔지니어로, 틈나는 대로 아이들을 위한 책도 저술하는 사람이라고 적어줬네요.
AI의 시대가 수십 년 후의 미래라고 생각했는데, 어느 순간 코앞으로 다가오고 있습니다. GPT-3는 “인공지능이 많은 일들을 하게 될 것이고, 그 여유시간에 인간은 더 많은 창작과 취미에 시간을 보내게 될 것이다.”라고 문장을 만들어냈다고 하죠. 매일매일 새로운 AI를 만나는 재미, 그리고 약간은 두렵지만 그 미래가 빨리 왔으면 하는 설렘이 공존하게 되네요.