AI 검색의 근본적인 문제점과 AI 검색의 미래

IT/IT월드

AI 검색의 근본적인 문제점과 AI 검색의 미래

썬도그 2024. 6. 7. 11:16

오래 살다 보면 참 많은 경험을 하게 됩니다. 제가 나름 기술과 테크에 관심이 많은지라 새로운 기술과 다양한 기술을 지켜보다 보면 이 기술이라는 것이 생각보다 제대로 아는 사람도 없고 기술 설레발이 엄청나게 심한 걸 잘 알게 되었습니다.

유비쿼터스, 4차 산업혁명, 메타버스, 3D TV, 3D 프린터 이런 것을 지켜보면서 느낀 건 마치 세상을 바꿀 것 같이 호들갑을 엄청나게 떨면서 등장했지만 지금 사라진 것도 많고 캐즘을 지나면서 차분해진 기술도 있고 실체가 없는 걸 있다고 우기는 것도 많았습니다.

유비쿼터스라는 단어를 매일같이 떠들던 SBS 8시 뉴스의 김소원 앵커의 말은 20년이 지난 지금도 잊혀지지 않네요. 2004년 경에 매일 같이 소개하더니 당시는 실현되지 않고 20년이 지난 최근에 실현되었죠. 모든 것을 초연결하는 세상이라는 뜻인데 요즘 유비쿼터스라는 단어를 사용하는 사람이 있나요?

4차 산업혁명은 IT 기술을 기반으로 한 새로운 지식 세계라는 것인데 이거 한국만 주로 사용하고 있는 건 아시나요? 주로 기업이나 관공서들이 툭하면 4차 산업 혁명을 외치더라고요. 미래 지향적인 뭔가를 말하고 싶은데 할 말이 없으면 가져다 쓰더라고요. 3D TV가 미래의 기술이라고 할 때는 어땠나요? 지금 3D TV 보는 사람이 있나요? 그냥 유행처럼 지나갔죠.

3D 프린터는 온갖 IT전문가들이 이제는 내가 원하는 걸 내가 직접 만들어 쓰는 시대가 되었다고 호들갑을 떨더만 일부에서만 사용하고 있죠. VR, AR도 그래도 그거 사용하는 사람은 소수이고 이 시장은 확장될 수가 없습니다. 폴더블 폰처럼 일부만 사용하고 확장되기는 어렵습니다.

AI 혁명은 실제지만 문제점도 참 많다

그럼 2023년 봄에 강타한 챗GPT를 필두로 한 AI 혁명은 어떻게 바라봐야 할까요? 이건 좀 다릅니다. 이미 아시잖아요. 생성형 AI 등장으로 주변에서 해고당한 사람도 많고 저 같은 블로거들도 큰 영향을 받고 있습니다. 수많은 블로거들이 생성형 AI를 이용해서 글을 써서 블로그를 운영하다 보니 스팸성 블로그가 엄청나게 늘어났습니다.

그런 생성형 AI로 쓴 글을 복사 붙이기해서 쓴 글들의 문제점은 정보의 정확도가 너무나도 떨어진다는 겁니다.

대표적인 사건이 삼일절 하얼빈 유래 사태죠.

행안부 3.1절 SNS 홍보물 논란의 원인은 챗GPT 복붙 블로그

윤석열 정권이 친일을 외치는 이유는 간단합니다. 80~90년대 군인이 대통령이었던 시절 외쳤던 국가 기조인 반공을 위해서 한미일 동맹을 강화하기 위해서입니다. 그럼에도 민족정서가 친일은

photohistory.tistory.com

위 글을 통해서 챗GPT의 답변의 부정확함과 함께 이걸 이용해서 글을 쓰는 양상형 블로그의 문제점, 그걸 걸러내지 못하는 네이버 같은 검색엔진의 문제를 모두 지적했습니다.

창작 영역은 잘 하고 있고 이쪽이 문제입니다. 이미지 생성형 AI로 인해 해고당한 일러스트레이터가 꽤 많다는 소리도 들리고 창작가인 소설가와 웹툰 작가들이 위협을 받고 있거나 해고당하고 있습니다. 최근 개봉한 영화 <퓨리오사 매드맥스 사가>에서는 아역 배우 얼굴을 실제 얼굴이 아닌 성인 배우의 얼굴을 합성해서 만들었다는 소리도 들립니다. 앞으로 배우도 다른 배우가 유명 배우 얼굴을 하고 연기하는 시대가 올 수도 있습니다.

그러나 팩트를 전달해야 하는 부문에서는 생성형 AI가 활약하기 쉽지 않습니다.
제가 그 예를 보여드리죠.

구글 제미나이에게 한국 영화 흥행 TOP10을 물어보다

한국 영화 중에 시리즈로 나온 영화들을 알려달라고 물어봤습니다. 한국 영화는 유난히 시리즈로 나오는 영화가 적은 가운데 '범죄도시' 시리즈가 흥행 대박을 나는 걸 분석하기 위해서 물어봤습니다. 그랬더니 범죄도시를 소개하네요. 여기까지는 좋습니다.

놀고 있네라는 말이 바로 나오네요. '미션 임파서블'이 한국 영화입니까? 심지어 홍콩 영화인 '해피투개더'는 시리즈물도 아닙니다. 2001년과 2011년에 속편이 개봉되었다고 하네요. 다 거짓말입니다.

한국 영화 중에 시리즈로 나온 영화 알려달라고 하니 '태극기 휘날리는 날'을 말합니다. 얼척이 없네요. '태극기 휘날리며'겠죠. 말하는 야수는 또 뭔 영화래요? '은밀한 거래'는 무슨 영화인가 포스터를 눌러보니

왓더~~~ 2009년 개봉한 영화 '마린보이' 포스터 속에 은밀한 거래라는 문구를 인식하고 영화 제목으로 '은밀한 거래'라고 소개하네요. 이 정도면 정말 똥멍청이 아닌가요? 이건 뭐 창작의 달인 수준이네요. 이게 바로 그 유명한 환각현상입니다.

역대 한국 영화 관객 동원수 TOP10도 제대로 소개 못하는 AI 검색들

미리 말하지만 AI 무용론을 말하는 건 아닙니다. AI의 문제점을 인식하고 AI 기술을 사용해야 한다는 겁니다. AI 기술은 이미 우리 주변에서 많이 적용되고 사용하고 있습니다. 실제로 생활의 많은 변화가 일어나고 있고 체감하고 있습니다. 그러나 문제점이 있는 점도 인지해야 합니다.

문제점은 바로 환각 현상입니다. AI들이 사람처럼 생각하기 시작한 건 다 구글의 트랜스포머 알고리즘 덕분이죠. 사람의 뉴런을 흉내 낸 이 알고리즘 하나가 사람처럼 단기 기억을 통해서 문맥을 이해하고 사물을 이해하고 글을 배우고 그림을 그리고 영상까지 만들고 있습니다. 사람만이 할 수 있다는 창작 영역에 들어온 것이죠. 문제는 두루뭉술수리한 생각 속에서 나오는 창작력은 좋은데 두루뭉술수리하면 안 되는 팩트 체크 분야에서는 문제가 많이 발생하고 있습니다.

구글 제미나이에게 한국 영화 중 흥행 TOP10이라고 질문을 했습니다. 이렇게 짧게 물어봐도 사람이면 찰떡같이 알아 듣죠. 한국 영화 중에서 관객동원수 1위부터 10위까지 알려달라고 생각하죠. 그럼 보시죠.

3위까지는 잘 대답을 합니다.

5위에 설민석이 등장합니다. 한국 영화 흥행 5위에 영화 '설민석'이 1230만 관객을 동원했다고 하네요. 엄청나죠? 쇼킹합니다. 영화 '설민석' 꼭 보고 싶네요.

이렇게 엉뚱한 대답을 하나씩 하게 되면 다른 정보를 믿을 수 있나요? 그냥 또 다시 검색을 해서 크로스체킹을 하죠.

이게 현재 AI 검색 수준입니다.

더 웃긴 건 2023년 개봉 영화 중 흥행 TOP10에 1위가 기적이랍니다. 2위는 용자는 죽지 않는다. 아주 소설가 나셨네요.

4위 헌트는 인도 경찰 같은 분이 포스터에 보입니다. 이런 AI 검색을 신뢰할 수 있습니까?

하도 멍청한 대답을 해서 이번엔 명확하게 '한국 영화 중 역대 관객동원 TOP10'을 물어봤습니다. 역시나 흥행 5위에 영화 '설민석'이 올랐네요. 뻔뻔하게도 공식통계라며 출처까지 표시하고 있습니다. 이 정도면 사기꾼 수준 아닌가요?

빙 코파일럿은 좀 달라요. 여기는 창작력을 줄이기 위해서 자신이 먼저 빙을 검색하고 그 검색 결과물에 나오는 웹 사이트나 블로그 글을 자기가 먼저 읽어보고 정리해서 보여주기에 좀 더 정확합니다. 그런데 Exhuma가 1위라고 하네요. 검색해 보니 파묘네요. 뭔 영문으로 소개하나 했는데 자료 출처가 해외 사이트인 박스오피스 모조에서 나온 것이네요.

그나마 가장 정확하고 점점 인기가 오르고 있는 Perplexity에 물어보니 한국 영화라고 말했구만 5위 어벤져스, 6위 겨울왕국2, 8위 아바타를 넣네요. 순위 자체는 맞습니다. 다만 한국 영화가 아닌 한국에서 흥행한 영화 TOP10이죠. 이렇게 말귀를 못 알아먹어요.

그럼 네이버 큐는 대답 잘할까요? 여기도 비슷하네요. 어벤져스, 겨울왕국2, 아바타가 들어가 있습니다.

비슷한 검색어를 넣으니 순위가 좀 바뀌었네요. 아바타가 사라졌습니다. 이런 AI 검색을 어떻게 믿고 사용하겠어요. 팩트 오류가 엄청 많은데요. 차라리 사람이 수작업으로 만드는 위키백과에서 검색하는 게 낫죠. 이게 현실입니다. 이런데 무슨 AI 검색이 미래다라고 할 수 있습니까?

AI 검색이 환각 현상을 줄이고 나아진다고? 그럼에도 문제점은 산적해 있다

최근 네이버는 네이버 검색에 네이버 큐를 적극 활용하고 있습니다. 이 영향으로 모든 블로그 방문자 숫자가 떨어지고 있습니다. 이는 티스토리뿐 아니라 네이버 블로그도 마찬가지입니다. 방문객들이 줄어든 이유는 네이버가 네이버 큐 검색을 상단에 배치해서 보여주기 때문입니다. 굳이 블로그 방문하지 않고 액기스만 쏙 빼서 먹습니다.

네이버 큐의 답변은 환각현상을 줄이기 위해서 하단 출처에서 내용을 뽑아와서 나열합니다. 그런데 우리는 저 출처를 클릭하지 않습니다. 이러다 보니 블로거들은 정보만 제공하고 수익을 낼 수 없습니다. 저도 네이버 블로그 하나 운영하고 있는데 최근 말도 안 되는 수익에 운영을 더 해야 하나? 하는 생각을 하고 있을 정도입니다. 수익이 줄다 보니 글도 덜 올리고 올리더라도 대충 써서 올리고 있네요. 악순환이죠.

콘텐츠 생산자들인 블로거들의 수익이 낮아지면 출처로 활용한 네이버 큐의 답변의 정확도도 떨어집니다.
한 사람이 A가 맞다고 하는 것과 10사람이 A가 맞다고 하는 것의 차이는 신뢰입니다. 한 사람이 한 말은 오류가 있을 확률이 높지만 여러 사람이 공통적으로 말하면 정확도가 상승하게 되죠. 마찬가지입니다. 앞으로 콘텐츠 생산자인 블로그가 줄고 생성형 AI로 글을 쓰는 오류 체크도 하지 않은 글들이 늘어나면 늘어날수록 네이버 검색 신뢰도는 떨어질 겁니다.

그래서 유튜브를 해야 한다고요?

Perplexity 같은 AI 검색은 아예 유튜브에서 내용을 추출해서 텍스트로 답변하고 있습니다. 저 유튜버들 영상 내용 날름 다 발라내서 소개하고 있네요 이러면 유튜브 영상도 안 보고 광고 수익도 없죠. 이런 미래에서 콘텐츠 생산자들은 AI 검색의 무료 납품업체 또는 강제 재능 기부자가 될 수밖에 없습니다. 이러면 누가 콘텐츠를 생산하겠어요.

AI가 하지 못하는 쾌락 위주의 재미와 유머와 자극적인 콘텐츠만 올라오겠죠. 이런 미래를 네이버, 구글은 원하는 것일까요? 지금까지 네이버와 구글 검색 생태계가 돌아간 것은 네이버 애드포스트, 구글 애드센스라는 콘텐츠 생산자를 위한 달콤한 당근이 있었기에 가능했습니다. 그런데 AI가 돈도 지불도 안 하고 과실을 날름 따먹기만 하면 누가 콘텐츠라는 과일을 심고 키우겠어요.

뭐 저도 이 블로그 언제까지 운영할지 모르겠지만 제 노동력 대비 수익이 나지 않는다고 판단하면 접을 듯 하네요. 솔직히 이 블로그 운영도 너무 오래 해서 그만하고 싶다는 생각이 많이 드는 요즘이네요. 그럼에도 운영한다면 재미로 하겠죠. 블로그가 수익이 떨어져도 운영하는 원동력 중 하나는 기록이니까요. 그렇게 되면 누군가에게 정보를 제공하는 용도가 아닌 그냥 제 개인 일상 기록처로 활용되겠죠.

그전에 카카오가 티스토리 블로그 서비스 중단할 수 있다는 생각이 드네요. 수 많은 부침을 겪어 봤지만 최근처럼 블로그가 위기인 적은 없었습니다. 시대의 변화라고 하기에는 창작자에 대한 대우가 낮아지면 낮아질수록 정보 소비자들은 더 낮은 품질의 검색 서비스를 접하게 될 겁니다. 그리고 무료로 사용하던 검색 서비스도 유료로 사용할 날이 올 수도 있겠다는 생각도 드네요. 왜냐하면 AI 검색할 때마다 전력 소비량도 엄청나고 비용이 엄청나거든요. 그런데 광고 붙이기도 쉽지 않으니까요.

저작자표시 비영리 변경금지