너도나도 AI를 외치고 있습니다. 너도나도 AI를 외치면 객관적인 시선보다는 주관적 시선이 늘어나고 마치 그 기술이 세상을 획기적으로 바꿀 것이라고 말하는 사람들이 늘어납니다. 그리고 그걸 사기에 활용하는 사람들도 늘어나게 되죠. 세상에 처음 선보이는 기술은 거품이 많이 낄 수밖에 없습니다. 따라서 1년 정도는 숙려 기간을 가지는 것이 좋습니다.
또한 신 기술에 대해서 공부를 좀 하면 그 기술에 휘둘리는 일은 크게 줄어들 겁니다. 꾸준히 AI에 대해서 공부를 하고 있습니다. 공부랄 것도 없이 AI 관련 강의나 영상을 유튜브에서 보면 이 기술이 엄청나게 어렵지 않다는 걸 알게 될 겁니다.
모든 시작은 2016년 선보인 구글 문맥 번역에서 나온 트랜스포머 알고리즘에서 시작되었죠. 여기에 기계학습과 딥러닝 기술과 함께 하드웨어 발달로 인해 불가능할 것 같았던 인간처럼 그림을 그리고 문서를 작성하고 영상을 만드는 작업까지 하는 단계까지 올라가고 있습니다.
태어나서 수 많은 기술을 봤지만 요 10년 안에 가장 큰 혁신이 생성형 AI입니다. 기술비관론자인 저도 인정할 정도로 확실히 생성형 AI는 미래를 완전히 바꾸지는 못해도 큰 변화를 이끌어낼 겁니다. 다만 수많은 강사들이 말하는 것처럼 세상을 개조한다는 정도는 아닙니다. 생성형 AI도 확실한 단점이 있으니까요.
이 생성형 AI는 텍스트를 생성하는 챗GPT만 있는게 아니라 텍스트를 입력하면 그 텍스트 내용을 인지하고 그림으로 만들어주는 생성형 AI도 있습니다. 대표적인 것이 스테이블 디퓨전과 챗GPT를 만든 오픈 AI가 만든 Dall-E와 미드저니 같은 생성형 이미지 AI가 있습니다. 그런데 이 시장에 카카오브레인이 만든 칼로(Karlo)가 참여했습니다.
카카오브레인이 만든 이미지 생성 AI 서비스 칼로(Karlo)
검색창에 칼로를 치면 칼로 찌른 사건이 검색이 됩니다. 그만큼 카카오브레인의 칼로에 대한 인기도 인지도도 낮습니다. 게다가 최근에야 홈페이지 링크가 검색되지 지난주까지만 해도 칼로라고 검색하면 홈페이지 링크도 알기 어려웠습니다. 그만큼 홍보가 거의 안된 서비스이고 관심도 없는 서비스입니다.
카카오브레인은 카카오의 미래 기술을 개발 연구하는 R&D 계열사로 최근 카카오로부터 투자를더 많이 받았습니다. 최근 카카오가 경영실패로 많은 카카오 계열사 및 카카오에서 인력 감축을 진행하고 있는데 카카오브레인은 더 많은 투자를 하고 있네요. 카카오도 알고 있는 것이죠. 미래는 AI 시장이 중요하다는 것을요. 그걸 잘 아는 회사가 무슨 수많은 엔터 자회사를 끌어들이는지 모르겠네요. 카카오는 엔터 회사로 목적지로 설정했다가 콘텐츠 사업이 휘청이자 인력 감축을 하고 있네요.
그렇다면 카카오의 AI 실력이 뛰어나냐? KOGPT를 내놓겠다고 하지만 미리 사용해 본 분들 말로는 그렇게 뛰어나지 않다는 말을 하더라고요. 저도 큰 기대를 안 합니다. 딱 카카오스럽게 내놓겠죠. 그럼에도 카카오 AI 서비스를 체험할 수 있는 것이 이 칼로(Karlo)입니다. 무슨 뜻인지 모르겠네요. '프라다 칼로'라는 멕시코 여성 화가를 본따서 만든 것 같기도 한데 스펠링은 다릅니다. 오픈 AI의 달리를 보고 벤치마킹한 이름 같기도 하네요.
카카오 칼로는 구글 계정으로 접속이 가능합니다. 정식 서비스를 할 때는 카카오 계정과 연동이 가능하겠지만 지금은 구글 계정으로 접속이 가능하네요. 아마도 글로벌 서비스를 지향하나 보네요. 그래도 그렇지 구글 계정으로만 접속하는 건 카카오 서비스와 연동을 목표로 하지 않는 것 같기도 하고요.
사실 이 서비스가 정식 서비스가 된다고 해도 이걸 사용할 카카오 서비스가 없습니다. 그나마 있는 것이 티스토리인데 티스토리는 유저 이탈이 심하고 사용한다고 해도 챗GPT와 칼로를 이용한 인공 스멜이 가득한 콘텐츠만 넘치게 되는 부작용이 일어날 것으로 예상됩니다.
메뉴는 꽤 복잡해 보입니다만 생각보다 쉽습니다. 프롬프트에 한글이나 영문으로 원하는 그림을 입력하면 됩니다. 전체적으로 영문으로 메뉴 설정이 되어 있네요. 베타 서비스이자 글로벌 서비스를 지향해서 영문으로 했나 봅니다.
Negative Prompt는 생성한 이미지 중에 제거하고 싶은 피사체를 입력하면 됩니다. 이 기능 꽤 좋네요.
왼쪽에는 생성 AI 모델명과 생성형 AI 이미지를 4에서 최대 8개로 설정해서 동시에 몇 개의 그림을 출력할지 선택할 수 있습니다. 이미지 해상도(image dimensions)도 4가지로 조절할 수 있습니다.
그리고 조절바가 있는데 여기서 막힙니다. 설명해 드리면
Step은 10~50까지 설정할 수 있는데 이미지 정밀도입니다. 좀 더 큰 이미지나 정밀한 이미지를 원하시면 50으로 놓으세요. 대신 생성 시간은 좀 더 느려집니다. 그래봐야 사용자가 많지 않아서 그렇게 오래 걸리지 않습니다.
Guidance Scale은 AI의 자유도를 말합니다. 숫자가 낮을수록 AI가 상상한 이미지를 많이 넣고 숫자가 높으면 텍스트에 충실한 이미지를 만들어줍니다. 따라서 20에 놓으면 입력한 텍스트를 그대로 따릅니다. 사실적 묘사를 원하면 20, 창작성이 높은 상상의 이미지를 만들고 싶으면 숫자를 내리면 됩니다.
Seed는 비슷한 스타일의 이미지를 계속 만들 수 있는데 -1은 랜덤 스타일입니다.
따라서 적당히 조절하면서 사용하시면 됩니다. 좀 사용해보니 칼로는 생각보다는 우수한 결과물을 내놓습니다. 또한 어떤 결과물은 꽤 좋네요. 이게 다 프롬프트에 어떤 단어와 문장을 입력하느냐에 결과물이 달라지긴 합니다만 대체적으로 생각보다는 좋습니다. 그럼 본격적으로 얼마나 좋은지 빙 검색에서 사용하는 달리와 비교해 봤습니다.
달리는 오픈 AI가 만든 이미지 생성형 AI로 사용하시고 싶으시면 MS 엣지 웹브라우저 설치한 후에 오른쪽 끝에 보면 붓 모양의 아이콘이 있는데 이게 오픈 AI의 달리입니다. 오픈 AI에 MS사가 10조 가까이 투자를 했고 두 회사는 협력 관계입니다. 사실 이 생성형 AI 한번 질문하고 이미지 생성할 때마다 엄청난 전기를 사용하고 돈도 많이 들어갑니다. 다만 유료화하기 전에는 무료로 체험해 볼 수 있습니다. 장사 잘 되고 인기 높으면 유료화하겠죠.
빙 검색 달리와 카카오브레인의 칼로를 비교해보다
프롬프트에 동일한 문장을 입력하고 출력해 봤습니다.
"조용한 서울 골목길에 자전거 탄 사람이 지나간다"를 입력하고 생성을 누르니
칼로(Karlo)
한국 서비스라서 일부러 한국을 설정했는데 마스크를 쓴 모습이나 딱 봐도 흔한 쫄쫄이 봇 입은 한국형 라이더 분들 느낌이 나네요. 한옥 마을 거리 같고요.
빙 검색의 달리
이건 외계어에 한국 거리와 분위기가 꽤 다르네요. 칼로 승리!
이번엔 "컴퓨터 업무를 보면서 사무실에서 전화를 받고 있는 백인 20대 여자'로 설정했습니다.
칼로
여러 검색을 해보니 사람 얼굴이나 동물 얼굴이나 정면이 아닌 옆모습이 꽤 많이 보입니다. 이유를 생각해 보니 얼굴 전체를 생성하는 것이 자신이 없는 듯하네요. 실제로 정면 얼굴이 담긴 사진 중에는 어색한 것이 많았습니다.
서울 광화문 광장에서 물놀이하는 아이들로 생성하면 얼굴이 이상한 사진이 나옵니다.
빙 검색의 달리
둘 다 꽤 좋은 결과물이네요. 다만 이 이미지생성형 AI가 사람의 얼굴을 제대로 구현해내지는 못하고 있습니다. 구체적으로 얼굴 묘사를 하면 그나마 낫지만 그냥 여자, 남자라고 지정을 하면 위 사진처럼 부자연스러운 사진도 꽤 많습니다. 그럼에도 위 흑백 사진은 너무 좋네요. 실제 사진인 줄 알았습니다.
참고로 빙 달리는 사진 왼쪽 하단에 b라는 워터마크가 박혀서 나옵니다.
장미꽃 향기를 맡고 있는 고양이
크고 약간 다크 한 느낌의 이미지는 빙의 달리이고 화사하지만 옆모습만 보여주지만 눈동자를 잘 안 보여주는 것이 칼로입니다.
비 오는 도시 거리에 빨간 우산을 쓰고 가는 여자를 따라가는 남자
빙 달리
얼굴 생성을 제대로 못하니 그냥 어둡게 처리를 하네요. 달리는 그럼에도 자연스럽게 숨기고 좀 더 리얼하네요.
칼로
칼로는 얼굴을 드러낸 사진이 있지만 모자이크 처리 하고 싶을 정도로 부자연스럽네요.
우주복을 입은 강아지가 우주복을 입은 고양이에게 우주선을 고치라고 명령하고 있다
이번엔 생성형 AI가 잘하는 상상력을 가미해야 하는 비현실적이지만 창의적인 이미지를 만들어 봤습니다. 이 생성형 AI는 환각 현상이 있어서 명확하게 기억하지 못하고 두루뭉수리로 기억하는 문제점이 있습니다. 그래서 팩트 체크력이 너무 떨어져서 자료 검색용으로 쓰다가 포기했습니다. 10개 질문하면 1,2개가 가짜 정보를 대답하는데 그거 믿고 글 썼다가는 큰 문제가 될 수 있습니다.
그래서 요즘 챗GPT나 구글 바드로 글 자동 생성해서 블로그 자동 포스팅 하는 분들 있는데 가짜 정보를 구글이나 네이버가 방치하지 않을 겁니다.
빙 달리
엄청나네요. 엄청나요. 아주 좋아요. 일러스트가 출판물로 사용해도 좋을 정도로 퀄리티가 엄청나네요. 달리는 이런 식으로 사용하면 딱 좋네요. 텍스트로 상상의 이미지를 만드는데 적합하겠네요.
칼로
반면 칼로는 흠.. 갑갑하네요. 분명 한국형 이미지 생성에 좋지만 전체적으로 이미지 생성 퀄리티는 달리가 칼로보다 좀 더 좋습니다. 다만 한국형 이미지는 좀 더 나은 느낌이 들긴 하고 AI 강도를 조절할 수 있다는 점과
스타일 변경 등등의 이미지 편집이 가능한 AI 캔버스 기능이 있지만 이 기능이 딱히 매력적이지 않아서 거의 쓰지 않게 되네요. 칼로보다 달리가 더 낫습니다만 때때로 칼로도 좋습니다. 기대 전혀 안 했는데 생각보다는 칼로의 성능도 괜찮네요.