본문 바로가기
카메라사진/사진에관한글

문장을 입력하면 바로 사진으로 만들어주는 NVIDIA GauGAN2

by 썬도그 2021. 11. 23.
반응형

백마디 말보다 1장의 사진이 더 위력적인 시각의 시대입니다. 예전에는 어떤 제품이나 위치를 설명할 때 수없이 긴 말로 설명했죠. 그러나 지금은 사진을 전송하면 끝입니다. 사람 생김새 설명도 그렇죠. 이렇저렇게 생겼고 어쩌고 저쩌고 하는 것보다 그냥 그 사람 사진 보내주면 끝입니다. 

그래서 텍스트의 힘은 점점 약해지나 봅니다. 그럼에도 여전히 텍스트 기반의 소설이 팔리고 책이 팔리고 있습니다. 그 이유는 텍스트는 동일하지만 그 텍스트를 보고 머리에 떠올리는 상상의 이미지는 다 다릅니다. 사람마다 경험과 성격, 성향이 다 다르고 가치관이 다르다 보니 같은 텍스트를 보고도 생각하는 이미지는 각자 다릅니다. 그래서 한 권의 소설을 읽은 100명의 사람이 그 소설 속 한 장면을 그리라고 하면 다 다를 겁니다. 

그런데 말로 설명하면 그걸 바로 사진으로 만들어 주는 기계가 있다면 어떨까요? 소름돋겠죠. 그런데 그 일이 실제로 일어났습니다. 

텍스트를 이미지로 만들어주는 NVIDIA GauGAN2 인공지능

엔비디아는 인공지능 기술을 꾸준히 구축하고 있습니다. NVIDIA GauGAN2라는 인공지능은 텍스트를 입력하면 그 이미지를 바로 바로 만들어주는 기술을 선보였습니다. 

엔비디아는 2019년 GauGAN라는 기술을 선보였습니다. 이 기술은 그림판에 대충 그림을 그리면 그걸 AI가 분석해서 사진처럼 만들어주는 기술입니다. 기존에 없던 풍경을 쓱쓱 그림을 대충 그리면 자동으로 만들어주기에 저작권을 피할 수 있고 상상을 바로 현실로 만들어주는 놀라운 기술이었죠. 

이 GauGAN가 진화한 GauGAN2는 그림 마저 필요 없고 텍스트를 입력하면 그걸 알아서 이미지로 만들어줍니다. 

위 GIF 파일처럼 텍스트를 입력하면 바로 그 텍스트에 부합한 이미지를 생성합니다. 이 기술은 엔비디아의 GauGAH 딥러닝 모델을 통해서 만들어진 기술로 누구나 아름다운 장면을 텍스트만 입력해서 만들 수 있습니다. 더 놀라운 건 실시간으로 이미지를 생성한다는 겁니다. 

화창한 날 끝없는 높은 산
안개가 낀 날 키 큰 나무로 둘러싸인 평화로운 호수
"위에서 하얀 모래 해변이 보이는 열대 섬

위 이미지는 각각의 텍스트를 입력했더니 바로 만들어 낸 사진이미지입니다. 현실적인 사진 이미지만 만들어내는 건 아니고 2개의 태양이 뜬이라고 쓰면 2개의 태양을 띄웁니다. 

물론 초기 기술이라서 100% 만족할 수 없습니다. 그러나 대충의 설명으로 내가 원하는 이미지와 비슷한 이미지를 바로 만들어서 사용할 수 있다는 점은 놀랍기만 하네요. 게다가 이 기술은 앞으로 더 큰 진화를 하기에 더 정교해질 것입니다. 

NVIDIA GAUGAN2 데모는 https://www.nvidia.com/en-us/research/ai-demos/ 에서 체험할 수 있습니다. 

반응형