본문 바로가기
IT/IT월드

스테이블 디퓨전, 미드저니 같은 이미지 AI로 축소될 사진 분야들

by 썬도그 2023. 3. 19.
반응형

AI가 폭발적으로 성장하는 이유는 생성형 AI 때문입니다. 기존의 AI는 판별용 지능이 뛰어났습니다. 이게 강아지니 고양이니?라는 판별력이 좋았죠. 그래서 수많은 이미지나 텍스트를 학습하고 이게 맞다 틀리다 식으로 판별만 했지만 구글이 트랜스포머 AI라는 생성형 AI의 시조새를 선보인 후 달라졌습니다. 

AI가 직접 노래도 만들고 시와 소설도 쓰고 이미지도 만들어내고 척척 대답도 합니다. 챗GPT에 세상 사람들이 정신이 쏠려 있는데 이미지 세계도 큰 파장이 일어나고 있습니다. 바로 생성형 이미지 AI인 스테이블 디퓨전과 미드저니가 엄청난 결과물을 내놓고 있습니다. 

미드저니 V5가 만들어낸 놀라운 사진급 이미지

생성형 이미지 AI는 챗GPT를 만든 오픈AI의 달리2(Dall E 2)와 소스를 오픈한 스테이블 디퓨전(Stable Diffusion)과 미드저니가 유명합니다. 

미드저니 V5

위 이미지를 보고 어떤 생각이 드세요? 전 후보정을 꽤 심하게 한 사진 같더라고요. 이 정도로 나오려면 후보정이 꽤 필요로 합니다. 카메라로 단박에 저런 사진 못 찍거든요. 그런데 중요한 건 제가 이걸 사진으로 인식했다는 겁니다. 그런데 아닙니다. 이 이미지는 카메라로 촬영된 사진이 아닙니다. 사진이 꼭 카메라로 찍히는 건 아니지만 최소한 광학 기술을 이용해야 합니다. 그래야 위 이미지에서 전경이 뿌옇게 흐려지거든요. 물론 요즘 후보정 스킬을 보면 전경, 후경을 쉽게 흐리게 하지만 누가 봐도 저 사진은 카메라로 촬영한 사진 같습니다. 

그런데 아닙니다. 미드저니 V5로 만들어진 이미지입니다. 놀랍기만 하네요. 사실 이 AI 생성 이미지는 눈썰미가 좋은 분들은 금방 알 수 있었습니다. 티가 꽤 났거든요. 그런데 미드저니 V5를 보면 구분하기 어려워졌네요. 

미드저니 V4
미드저니 V4 생성 이미지
미드저니 V5
미드저니 V5 생성 이미지

제가 위 두 이미지를 페북에 올렸더니 공유를 몇 분이 하시네요. 저도 놀랬으니까요. 미드저니 V4만 해도 그냥 그렇구나 했는데 미드저니 V5는 사진 그 잡채네요. 미드저니 V5는 현재 테스트 중이고 조만간 공개될 것으로 보입니다. 

미드저니 V5

미드저니 V5는 이미지 생성 AI의 최대 약점인 손가락 구현을 제대로 못하는 문제도 해결했다고 합니다. 이 이미지를 보면서 많은 사람들이 이제 사진은 끝났다고 생각하는 분들이 꽤 있을 겁니다. 그러나 챗GPT가 구글 검색을 100% 대신할 수 없고 이런 AI 생성 이미지가 사진을 100% 대처할 수는 없습니다. 그럼에도 분명 영향을 주고 몇몇 분야는 빠르게 AI로 대체될 수 있다는 생각도 듭니다. 

반응형

이미지 생성 AI가 절대 건드릴 수 없는 사진 분야 기록사진 

라이카 M 카메라

우리가 사진을 예술의 도구, 표현의 도구로만 인식하는 경우가 많은데 사진이 가지는 기본 속성은 기록입니다. 사진보다 뛰어난 기록 매체는 현재 없습니다. 점점 동영상으로 넘어가지만 동영상은 여전히 용량도 높고 보려면 여러 조건이  필요로 합니다. 따라서 우리는 인증샷이라는 말로 대변할 수 있듯이 사진은 뛰어난 기록 매체입니다. 이미지 생성 AI는 기록 사진을 만들지 못합니다. 각종 소스를 받아서 연출 사진을 만든다고 할 수 있죠. 

이미지 생성 AI에 의해 축소될 사진 분야

1. 스톡 사진

가장 큰 영향을 받을 곳은 스톡 사진 사이트입니다. 스톡 사진은 연출 사진만 가득한 사진 이미지 창고입니다. 그런데 이 연출 사진을 텍스트 몇 줄로 쉽게 재현하거나 구현다면 스톡 사진 인기는 뚝 떨어질 것입니다. 이에 셔터스톡은 자신들의 스톡 사진으로 AI 기계학습을 시켜주는 대신 AI가 만든 사진이 팔리면 일정량의 원본 데이터를 만드는 데 사용한 사진에게 사진 저작권을 나눠주는 개념을 심고 있습니다. 쉽지 않은 결정이자 과정이자만 대처하고 있습니다. 

그러나 게티이미지 같은 곳은 절대로 AI로 만든 이미지를 업로드하는 것도 제공하는 것도 안 하겠다고 문을 걸어잠궜습니다. 당장 스톡 사진 사이트들이 사라지거나 엄청난 매출 축소가 일어나지는 않을 겁니다만 5년 후에는 스톡 사진 시장이 크게 축소될 것은 확실합니다. 

2. 모델

우리는 잘 생긴 모델에게 옷을 입히고 사진을 찍습니다. 몸에 걸치는 옷이나 액세서리 등은 몸매가 좋고 잘생긴 모델들이 매출에 큰 영향을 줍니다. 그러나 AI가 여러 얼굴을 학습해서 얼굴을 직접 창조하게 되면 모델이 필요 없습니다. 몸은 사람이 대신한다고 해도 얼굴은 AI 생성 얼굴로 대처하면 되니까요. 또한 몸도 AI에게 옷에 대한 데이터를 학습시키면 그냥 모델 없이 옷 피팅 사진을 담을 수 있을 겁니다. 

3. 콘셉 연출 사진

기록 사진은 AI가 접근할 수 없는 영역이지만 창의력이 필요로 하는 만드는 메이킹 포토 사진들은 AI들에게 많이 의탁하거나 인력이 점점 축소될 것입니다. 연출 사진을 촬영하는 분들, 상업 사진 등등 사진 합성과 연출을 자유롭게 했던 분들은 지금부터라도 이 이미지 생성 AI에 대해서 관심을 가지고 대비해야 할 겁니다. 

물론 이미지 생성 AI가 연출 사진 100% 대체하지는 못합니다. 제가 보기엔 그냥 조수 역할 또는 영감을 주는 조력자 역할을 하고 마무리는 사람이 해야 하는데 이 마무리는 또 기존 상업 사진가들이 잘합니다. 따라서 작업 시간이 축소되기에 더 많은 일을 할 수 있게 된다고 할 수 있습니다. 그러나 그런 식으로 로봇 및 인공 지능 시대를 장밋빛으로 보는 사람들이 최근에는 그냥 일자리만 주는 것을 보면서 판단이 잘못되었다고 스스로 인정하고 있습니다. 더 많은 일을 할 수 있으려면 일이 많아야 하는데 일이 늘어나지 않습니다. 

시대가 변하면 누가 빨리 적응하고 따라가느냐인데 당장 큰 위협은 없지만 5년 안에 큰 변화가 서서히 진행될 듯 하네요. 그러니 지금부터 대비. 하셔야 상업 사진에서 살아남을 수 있을 것 같네요. 

반응형