인공지능 기술 GAN
많은 AI전문가들은 미래의 인공지능은 비지도학습이 이끌어갈 것이며 그 중심에는 GAN(Generative Adversarial Networks)이 있을 것이라고 전망합니다.
“What I cannot create, I do not understand.”
- 노벨 물리학상을 받은 미국의 물리학자 Richard Feynman
Richard Feynman의 명언은 비지도학습의 의미와 일맥상통합니다. 비 지도 학습(Unsupervised Learning)은 기계학습의 일종으로, 데이터가 어떻게 구성되었는지를 알아내는 문제의 범주에 속한다.즉, 정답 없이 새로운 것을 지속적으로 생성해 낼 수 있는 능력을 가진다는 것은 그 데이터를 완전히 이해하고 있다는 의미로서 생성할 수 있는 능력을 가지게 되면, 분류하는 것도 자동적으로 쉬워진다는 이야기입니다. 어려운 수학 문제를 다른 사람에게 설명을 잘 할 수 있다면, 그 문제를 푸는 일은 식은 죽 먹기일 것입니다. 이러한 개념이 비지도학습의 대표주자인 GAN에 적용되고 있습니다.
다음은 GAN로 데이터를 생성하여 본래의 사람처럼 똑같은 목소리와 표정까지 그대로 재생하는 GNA기법으로 생성된 컴퓨터이다.
어느 쪽이 진짜인지 구별이 불가능합니다.
원본 사진으로 데이터를 분석하여 인공지능을 제작하는 기능인데 정말 어느 것이 진짜 인지 식별이 불가능합니다.
처음 GAN을 제안한 Ian Goodfellow는 GAN을 경찰과 위조지폐범 사이의 게임에 비유했습니다.
위조지폐범은 최대한 진짜 같은 화폐를 만들어(생성) 경찰을 속이기 위해 노력하고, 경찰은 진짜 화폐와 가짜 화폐를 완벽히 판별(분류)하여 위조지폐범을 검거하는 것을 목표로 합니다.
이러한 경쟁적인 학습이 지속되다 보면 어느 순간 위조지폐범은 진짜와 다를 바 없는 위조지폐를 만들 수 있게 되고 경찰이 위조지폐를 구별할 수 있는 확률도 가장 헷갈리는 50%로 수렴하게 되어 경찰은 위조지폐와 실제 화폐를 구분할 수 없는 상태에 이르게 됩니다.
여기서 경찰은 분류 모델, 위조지폐범은 생성 모델을 의미하며, GAN에는 최대한 진짜 같은 데이터를 생성하려는 생성 모델과 진짜와 가짜를 판별하려는 분류 모델이 각각 존재하여 서로 적대적으로 학습합니다.
인공지능이 스스로 학습하는 딥러닝 방식으로 렘브란트 작품 346개를 학습하여 학습한 인공지능에 새 그림을 명령하자 성별, 표정, 옷깃, 손동작 등 주제에 맞는 원본을 묘사하기 시작하여 본래와 똑같은 방식으로 묘사하는 인공지능이다.
유화의 질감을 살리기 위해 3D프린터로 출력한 렘브라트 그림은 거의 완벽할 정도로 똑같이 그려졌다.
'빛의 화가'가 그린 것처럼 빛과 어둠을 완벽히 배합해낸 인공지능이다.
해당 사진들은 생성적 적대 신경망(GAN)에 사용된다.
GAN은 두 개의 인공 신경망, 즉 생성기(generator)와 판별기(discriminator)가 상호 경쟁하는 동시에 서로를 훈련시키면서 실제와 가까운 새로운 이미지‧영상‧음성 등을 자동으로 만들어내는 AI 기계학습 방법론의 하나다.
사용 방법은 매우 간단하다.
정면을 바라보고 있는 선명하게 찍힌 얼굴 사진을 업로드하면 끝이다.
그러면 AI 시스템이 알아서 나와 닮은 20명 정도의 도플갱어 사진을 만들어낸다.
얼굴 이미지 생성 후 추가적인 기계학습(ML) 과정을 통해 결함을 찾아 제거한다.
이제 마음에 드는 닮은 꼴을 골라 SNS 프로필 사진 대신 사용하기만 하면 된다.
한 대학생이 이 기술을 이용해서 사람 얼굴을 만화로 만들수 있을까?
인공지능이 일반 사진도 학습하면 명작처럼 바꾸는 것이 가능하다.
원본이미지를 이용하여 더 자연스러운 다른 생성 이미지로 원본보다 더 진짜 같은 가짜를 만들어 낸다.
GAN이 명작의 특징을 학습하면 일반 사진도 명작처럼 탈바꿈 할 수 있다.
이것이 바로 인공지능 GAN의 대단함이다.
GAN이 대단하다는 것은 이것을 만들어 응용하는 현대인이 대단하다는 것이다.
인공지능의 미래는 과연 어떤 모습으로 우리들이 살아갈지 궁금합니다.