생성형 AI로 인해 많은 분들이 직업을 잃고 있습니다. 특히 창작의 분야라서 AI가 절대 접근하기 어려운 창작자들이 큰 위협을 당하고 있고 있고 실제로 일자리를 잃고 있죠. 그러나 전문가가 달리 전문가인가요? 새로운 툴이 나오면 일반인보다 전문가들이 창작자들이 더 세밀하게 이용할 수 있죠. 또한 모든 AI 가 100% 완벽한 것이 아니라서 정밀 조정을 해야 하는데 이게 기존 전문가 또는 창작자들이 더 잘합니다.
다만 저 같이 그림이나 음악을 전혀 모르는 사람들도 이제는 쉽게 이미지를 만들어서 사용할 수 있어서 좋습니다. 즉 진입문턱이 무척 낮아졌습니다. 나쁜 점도 있죠. 대표적으로 티스토리로 티스토리의 새로운 글 대부분이 생성형 AI 글로 쓴 글들이 난무하고 있습니다. 오늘도 자동툴로 단 댓글을 보면서 바로바로 다 차단하고 있습니다. 이런 자동화 AI 툴로 인해 망해가는 서비스가 티스토리가 되었네요.
이미지 생성형 AI의 프롬프트를 잘 모르는 분들에게 좋은 구글 위스크(Whisk)
미드저니나 스테이블 디퓨전은 가장 유명한 이미지 생성형 AI입니다. 그러나 내가 원하는 이미지를 만드려면 수많은 프롬프트를 넣었다 수정했다 하면서 지난한 시간을 가져야 합니다. 그렇게 이미지생성형 AI는 얼마나 프롬프트를 잘 작성하느냐에 따라서 내가 원하는 이미지를 아주 빠르게 만들 수 있습니다.
그런데 프롬프트를 영어로 작성해야 하는 문제점이 있습니다. 어휘력이나 묘사력이 낮은 사람은 하기 어렵죠. 물론 이런 것을 챗GPT에 프롬프트 만들어 달라고 해도 되긴 합니다. 그러나 그것도 귀찮습니다. 요래 요래 말로 설명하지 않고 사진이나 그림을 보여주면서 이 스타일로 만들어줬으면 해!라고 하면 얼마나 좋을까요?
그게 바로 구글 위스크(Whisk)입니다. 구글 위스크는 프롬프트에 장황하게 설명해야 하는 텍스트 대신에 3장의 사진을 넣어서 간단한 프롬프트로 만들 수 있습니다.
얼마나 따끈따끈한 서비스인지 검색해도 URL이 나오지 않습니다. 이게 구글 정식 서비스가 아닌 구글 랩이라는 연구하는 부서에서 만든 베타 서비스입니다. 잘 되면 유료화가 가능할 정도로 성능이 좋네요.
https://labs.google/fx/ko/tools/whisk
Whisk - labs.google/fx
labs.google
위 링크를 접속한 후 처음부터 새로 시작을 누르세요.
구글 위스크 사용법
사용법은 간단합니다. 왼쪽에 피사체에 내가 크게 담고자 하는 주 소재가 되는 피사체 사진을 업로드합니다. 장면에는 배경이 되는 사진을 넣습니다. 그리고 스타일에는 내가 원하는 스타일의 사진이나 이미지를 넣습니다. 저는 라이카 카메라와 벚꽃을 배경으로 넣고 스타일은 지브리 애니 한 장면을 넣고
'19세기 영국 병사가 라이카 카메라로 벚꽃을 배경으로 관광객을 촬영하는 사진을 찍어 달라고 요청했습니다.
여러 장의 이미지를 선보였는데 카메라가 작게 나왔네요. 이럴 때는 세부조정 옆에 있는 더 보기 메뉴에서 프롬프트를 직접 수정하거나 세부 조정을 통해서 조정이 가능합니다.
이게 프롬프트입니다. 원래는 이런 식으로 내가 직접 다 넣어줘야 합니다. 그러나 이런 묘사를 언제 해요. 그래서 구글 위스크는 텍스트 대신 내가 원하는 피사체와 배경 스타일을 넣어서 만들어 달라고 하면 됩니다. 포즈나 상황 묘사는 내가 해야겠죠.
한쪽 무릎을 꿇고 단체 사진 찍어주고 하트와 풍선 들고 있으라고 하니 이렇게 만들어주네요. 얼굴이 기이하죠. 그래서 얼굴 정교하게 그려달라고 하면 또 수정을 해줍니다. 수정에 수정을 하면서 원하는 이미지를 만들 수 있습니다.
이렇게 라이카 카메라를 크게 담고 스타일과 배경을 바꾸면 라이카 카메라가 전면에 나옵니다.
이번엔 무빙의 고윤정을 넣고 배경은 그리스 산토리니 사진과 스타일은 무빙 웹툰 이미지를 넣었습니다.
어? 그런대로 잘 그려주는데 고윤정은 아니네요. 이게 그럴 수밖에 없는 것이 피사체를 입력해도 그대로 담지 않고 그 특징을 텍스트로 추출합니다. 예를 들어서 고윤정 사진을 보고 20대 한국 여자, 포니테일 머리, 셔츠를 입고 있는 모습만 추출해서 저장한 후 자기가 랜덤 하게 만듭니다. 따라서 캐릭터 일관성 유지는 같은 프롬프트에서 되지만 새로 시작하면 다른 이미지가 나옵니다. 그럼에도 서양 캐릭터는 일관성을 꽤 유지하네요.
같은 프롬프트에서는 잘 유지하니 짧은 동화나 숏폼용 이미지 제작에는 적합합니다.
피사체나 장면이나 스타일 사진이 없으면 왼쪽 상단 주사위 버튼 누르면 추천 스타일을 몇 개 선보이니다. 여기를 눌러서 선택해도 됩니다. 양산을 쓰고 콘 아이스크림을 먹고 있고 갈래기 3마리 넣어달라고 했더니
이렇게 만들어주네요.
물 웅덩이를 피해서 점프하는 이미지는 이렇게 만들어주고요. 꽤 쉽게 내가 원하는 사진을 만들 수 있는 것이 구글 위스크의 장점입니다.
이번엔 카리나을 넣고 만들어 봤습니다. 이게 보니까 스타일은 그 사진의 색감과 특징을 잡아내네요. 80년대 포스터 넣으면 올드한 빈티지 색감을 추출해서 필터로 입히는 느낌입니다.
카리나가 절대 아니죠. 그러나 바게트 빵은 들고 있죠.
애니풍으로 하니 좀 더 카리나 같네요.
이상하게 애니나 일러스트 스타일로 하면 원본 사진과 비슷해요.
이번엔 캐논 V1 카메라를 들고 있는 20대 여자가 꽃 사진을 찍고 있는 사진을 넣어달라고 해봤습니다.
정말 어디서 본 듯한 느낌적인 느낌의 전형성이 꽤 있는 한국 20대 여자 얼굴에 후지필름 카메라를 들고 있네요. 이에 캐논 마크 넣어달라고 했더니
캐논 마크가 들어갔습니다. 그러나 자세히 보면 좀 오류가 있습니다. 참고로 텍스트는 영어는 그런대로 잘 나오는데 한글은 외계어입니다. 이게 바로 AI의 환각 증상이에요. 수많은 신경망 시냅스 같은 것들이 연결되어서 만들다 보니 100% 똑같이 않고 두루뭉술수리하게 만들다 보니 이런 텍스트 묘사에서 오류가 참 많습니다. 그만큼 이미지에서 숫자나 텍스트의 의미를 다 알지 못한다는 소리입니다.
물론 이걸 포토샵에서 수정 교체하면 되긴 합니다. 그래도 이런 사진 얻으려면 이전에는 셔터스톡 같은 스톡 사진 사이트에서 다운로드해야 했지만 말 안 하면 알 수 없을 정도로 잘 만드네요. 저 빨간 띠의 스트랩 묘사하는 거 보세요.
프롬프트 입력하기 귀찮고 스테이블 디퓨전은 뭘 엄청 깔아야 하고 복잡해서 좀 만지다가 빙 코파일럿에서 만들다가 품질을 너무 저질이라서 거의 사용 안 했는데 이 구글 위스크는 가끔 이용해 봐야겠습니다. 어떤 분은 이걸 이용해서 AI 동화책 만들어서 돈 벌고 숏폼 만들기도 하더라고요.
빙 코파일럿에 의뢰했더니 아후 이 빙 XXXXX. 구글 위스크는 사랑입니다.
만든 이미지들은 내 라이브러리에서 다시 다운로드할 수 있는데 프롬프트 수정은 안 되네요. 이건 좀 아쉽습니다.