본문 바로가기
IT/IT월드

검색의 대변혁이 예감 되는 빙 검색의 챗GPT 기반 채팅 서비스

by 썬도그 2023. 3. 5.
반응형

챗GPT는 기본의 답답한 챗봇과 달리 상당히 뛰어난 그리고 인간이 하는 대답처럼 느끼게 하는 능수능란한 답변에 많은 사람들이 꽤 놀라워하고 있습니다. 어떤 웹페이지 내용을 정리하라면 정리도 하고 소설을 써 달라고 하면 소설 시놉시스를 쓰고 3행시도 씁니다. 

엄청난 결과물을 내놓자 많은 사람들이 놀라움을 넘어서 생활에 활용하고 있습니다. 실제로 사용해 보면 꽤 좋은 대답을 하지만 몇 번 사용하다 보면 거짓말도 잘하는 걸 알게 되어서 실망하게 됩니다. 그래서 반신반의하다가 매번 진짜인가? 다시 검색엔진에서 검색을 하는 번거로움에 인기가 조금씩 떨어지고 있습니다. 

챗GPT의 문제점은 거짓 정보도 꽤 많다는 점과 2022년 이후 정보는 학습을 못해서 알지 못한다는 점 그리고 검색 엔진과 연동하지 못한다는 점이 있습니다. 이런 단점을 보완 한 서비스가 바로 나왔습니다. 바로 한국에서도 해외에서도 큰 인기가 없는 MS사의 검색 서비스인 빙(Bing)이 챗GPT 기반의 검색 조력 서비스를 선보였습니다. 

프로메테우스 모델 기반, 빙 검색의 챗GPT 기반 채팅 서비스

빙 검색의 챗GPT 기반 채팅 서비스

챗GPT의 광풍이 일던 2월 초인 2023년 2월 7일 MS사는 오픈AI와 제휴해서 챗GPT의 업그레이드 버전인 프로메테우스 모델을 기반으로 한 빙 검색의 새로운 검색 조력 서비스를 선보였습니다. 챗GPT처럼 채팅 형식으로 검색을 할 수 있습니다. 

오픈 AI와 손을 잡을 수 있었던 것은 MS사가 오픈 AI에 수조 원의 투자를 했기에 가능했습니다. GPT3.5 기반이고 챗GPT와 달리 검색엔진을 품고 있습니다. 또한 2022년 이후 최신 자료까지도 대답으로 내놓고 있습니다. 더 중요한 것 챗GPT는 유료와 무료 버전이 있는데 반해 이 빙(Bing)에 추가된 AI 채팅 서비스는 무료로 제공합니다. 

단 질문의 연속성은 6~8개 정도이고 하루 60개만 질문할 수 있습니다. 

새로운 빙 검색의 AI 채팅 서비스를 사용하려면?

아무나 사용할 수 있는 건 아닙니다. 조건이 있습니다. 
먼저 MS사가 만든 엣지 웹 브라우저를 사용해야 합니다. 구글 크롬에서는 안 됩니다. 또한 MS 계정으로 신청을 하고 좀 기다려야 합니다. 전 2월 초에 신청했는데 1주일 정도 되니까 사용이 가능해졌습니다. 

빙의 GPT 3.5 기반의 프로메테우스 AI 채팅 검색 서비스를 사용해 보다

빙 검색의 챗GPT 기반 채팅 서비스

빙 검색창에 검색어를 입력하면 상단에 채팅 입력창이 나오고 왼쪽이나 오른쪽에 '새 Bing에 오신 걸 환영합니다!' 밑에 AI 기반 응답엔진 질문하기가 뜹니다. 여기나 채팅 창을 눌러도 됩니다. 아니면 위 이미지처럼 빙 초기 화면에서 상단의 채팅을 눌러도 바로 사용할 수 있습니다. 

빙 검색의 챗GPT 기반 채팅 서비스

이게 빙의 AI 채팅 기반 서비스입니다. 이거 사용해 본 분 중에는 너무 놀라운 결과를 내놓아서 빙이 신이 되었다고 해서 빙신(Bing 신)이라고 하는 분도 있습니다. 결론부터 말하자면 신이라고 하기엔 너무 많은 오류와 문제점이 많습니다. 그럼에도 챗GPT보다는 좀 더 나은 결과를 선보입니다. 기존 검색 엔진보다는 좀 더 나은 정도입니다. 

빙의 AI 채팅 검색 서비스는 대화 스타일을 선택할 수 있습니다. 창작, 균형 잡힘, 정확함이 있는데 사실 기반 대답만 원하면 정확함으로 어떤 사실을 기반으로 어느 정도 창작도 가능한 대답을 원하면 창작을 누르면 됩니다. 

빙 검색의 챗GPT 기반 채팅 서비스
빙의 AI 채팅 검색 서비스 (정확함)

예를 들어서 영화 비상선언이 흥행에 실패한 이유를 정확함 모드로 물으면 '신파 서사' 때문이라는 지적을 합니다만 

빙 검색의 챗GPT 기반 채팅 서비스
빙의 AI 채팅 검색 서비스 (창작)

 창작 모드로 물으면 외계인의 침공을 막기 위한 특수 부대가 투입되는 스토리라는 정말 소설 쓰고 있는 대답을 합니다. 따라서 팩트가 중요한 대답을 원하면 정확함을 선택하세요. 

빙 검색의 챗GPT 기반 채팅 서비스

빙의 AI 채팅 서비스가 챗GPT와 크게 다른 점은 자신의 대답 근거를 하단에 깔아줍니다. 보시면 대답의 내용을 블로그, 웹사이트 등에서 발췌했다고 자세한 정보에 표기를 합니다. 논문 식으로 주석을 달아 놓습니다. 따라서 신뢰 바탕은 다른 웹문서와 블로그 글입니다. 또한 자세한 정보 옆에 보면 1/8이 있는데 이는 연속된 관련 질문을 최대 8개까지 할 수 있습니다. 그 이상 넘어가면 하단의 빗자루를 눌러서 채팅창을 지우고 새로운 질문으로 시작해야 합니다. 

그런데 좀 놀라운 건 근거를 찾아서 들어가면 그 블로그에는 대답 내용이 나오지 않아서 당혹해할 경우가 꽤 있습니다. 예를 들어서 외계인 침공을 맞서는 내용이 비상선언에 있다는 근거 링크를 따라가 보니 그 블로그 글에는 외계인 침공 내용이 없습니다. 

빙 검색의 챗GPT 기반 채팅 서비스

또한 비슷한 질문도 어떤 질문은 대답을 하고 어떤 질문은 대답을 못합니다. 

빙 검색의 챗GPT 기반 채팅 서비스

또한 캐논 카메라의 장점과 단점을 질문했는데 답변 퀄리티가 뛰어나지는 않네요. 투명한 수채화 느낌의 색감? 이게 캐논 카메라의 장점이라고 할 수도 있지만 보통은 인물, 음식 사진의 붉은색을 잘 표현하는 것이 캐논의 장점이죠. 그걸 대답 못합니다. 자세한 정보 출처를 보니 캐논 카메라 중에 EOS R 카메라에 대한 장점 단점도 보입니다. 

문제는 보편적인 대답과 공감도 높은 대답을 해야 하는데 일부 블로그의 주관적인 느낌을 적은 것을 그대로 반영하다 보니 객관적인 대답을 들을 수는 없습니다. 보통 우리는 캐논 카메라의 단점을 검색을 통해서 보통 3개 이상의 블로그 글을 읽고 공통된 단점과 이유를 들어보고 결론을 내죠. 그런데 생각보다 빙 AI 채팅은 멍청하네요. 꼴랑 한 블로그에서만 자료를 추합 한다? 이럴 거면 기존 검색엔진이 더 낫죠. 

빙 검색의 챗GPT 기반 채팅 서비스

게다가 저도 블로거이지만 블로그 글의 신뢰성이 높은 건 아닙니다. 특히 추천해 달라고 하면 추천!이라는 단어가 들어간 포스팅을 바탕으로 소개하는데 블로그 리뷰 중에 제품을 제공받고 작성한 리뷰나 원고료를 제공받거나 '쿠팡 파트너스' 글이 상당히 많이 보입니다. 이런 광고성 글을 걸러내지 못하네요. 

생각보다 멍청해서 좀 놀랬네요. GPT3.5로 챗GPT보다 한 단계 높다는데 검색 결과를 보면 챗GPT보다 멍청합니다.  다만 챗GPT와 달리 2023년 정보도 잘 검색합니다. 물론 몇 개 질문하고 판단하긴 어렵긴 하지만 직접 해보시면 아실 겁니다. 생각보다 대답 출처가 오래된 자료에서 가려오거나 무작위로 가져오는 느낌입니다. 

물론 백두산 높이나 63 빌딩 높이 같은 명확한 정보는 쉽고 빠르게 말하는데 조금만 추상적이고 주관이 필요한 대답은 잘하지 못합니다. 

빙 검색의 챗GPT 기반 채팅 서비스

팩트도 그래요. 국회도서관 이용시간이 2023년 변경되어서 현재는 평일은 오전 9시부터 오후 9시까지입니다. 
그런데 보시면 작년 자료인 오전 9시 ~ 오후 10시라고 말합니다. 잘못된 정보입니다. 

빙 검색의 챗GPT 기반 채팅 서비스

틀린 정보라고 알려주니 빤스런까지 하네요. 

빙 검색의 챗GPT 기반 채팅 서비스

이에 국회도서관 이용 시간이 틀렸다고 지적하니 정보가 잘못되었으면 알려달라고 하기에 알려줬습니다. 그런데 반영이 안 됩니다. 흥미로운 점은 자세한 정보에는 제 블로그 글이 있고 여기에 정확한 정보가 있습니다. 그런데 대다수의 블로그의 글이 작년 기준의 정보이다 보니 변경 전 이용시간의 글이 더 많다고 그게 옳다고 판단합니다. 이게 문제죠. 잘못된 정보나 최근에 바뀐 정보량보다 이전 정보가 더 많으니 틀린 정보를 알려줍니다. 

이 챗GPT가 비지도형 머신러닝을 바탕으로 하는데 이 비지도형 방식의 문제점은 오류가 많다는 겁니다. 그래서 중간중간 인간이 개입해서 정보를 수정해 주면 또 자가학습을 하면서 정보의 정확도를 높입니다. 그러나 인간의 개입을 모든 정보에 할 수 없죠. 또한 인간이 개입할 때 그 인간의 신뢰도도 문제입니다. 일부러 잘못된 정보를 인간이 가르치면 오히려 더 신뢰도가 떨어집니다. 

이게 자동화의 문제점입니다. 수동 방식은 인간이 알아서 필터링을 하고 크로스체크를 하고 무엇보다 블로그의 명성을 보고 판단을 합니다. 

정보 출처의 신뢰성에 대한 가중치가 없는 빙 AI 검색 서비스에 대한 신뢰성도 높지 않다

우리가 어떤 정보를 접할 때 그 정보의 출처를 보죠. 카메라 추천해 달라고 했더니 쿠팡 파트너스 수익을 위해서 쿠팡 판매 순위 긁어서 쓴 글보다는 카메라 리뷰 글이 엄청나게 많은 블로그 글 중에 어떤 글이 더 신뢰도가 높을까요? 유튜브가 인기 있는 이유가 구독 기반 서비스라서 그렇습니다. 구독자가 많을수록 신뢰도 높은 정보를 담을 확률이 높습니다. 

유튜버도 구독자 10명일 때보다 1만 명, 10만 명 일 때 정보의 무게가 달라집니다. 10만명 직원 고용해서 전문적으로 정보 크로스체킹까지 해서 정보를 담죠. 그래야 구독자들의 신뢰를 유지할 수 있으니까요. 따라서 자료 출처에 대한 신뢰도 랭킹을 메기고 살펴야 합니다만 빙 AI 검색은 무지성 검색을 합니다. 

빙 검색의 챗GPT 기반 채팅 서비스

브이로그 카메라 추천 해달라고 했더니 출처 3개 모두 쿠팡 파트너스 글입니다. 아시는 분들은 아시겠지만 요즘 챗GPT를 이용한 자동 포스팅 글들이 넘쳐나고 있습니다. 신뢰도 낮은 블로그 포스팅인 넘치고 있습니다. 이를 검색엔진이 걸러내야 합니다. 검색에 잘 노출이 안 되어야 자동 포스팅 질도 멈추게 되는데 빙 검색은 이걸 잘 구분 못합니다. 

그나마 네이버가 인기가 높은 것이 이 자동 포스팅이나 신뢰도 낮은 글을 잘 걸러냅니다. 
흥미로운 건 네이버가 자동 포스팅이나 질 낮은 글을 걸러내는 방법이 2015년 이전 블로그를 개설한 블로그 글만 우대하는 정책 때문이라고 하죠. 2015년 이전에 개설한 블로그들은 돈 벌기 위해서 자동 포스팅 남발하는 스팸 블로그가 적기 때문이라는 판단인데 이게 지금 생각하면 현명한 판단으로 보입니다. 

네이버는 이를 넘어서 자기들이 다 꼼꼼히 검사해서 일정 수준 이상 퀄리티가 높은 글을 하나의 주제로만 발행하고 다양한 SNS 활동지수를 살펴보고 프로 블로거 인증 마크 같은 인플루언서 제도를 도입했죠. 블로그의 양반 제도라고 할 수 있는데 챗GPT가 몰고 온 자동 포스팅 난무하는 요즘 모습을 보면 네이버가 인플루언서라는 방파제를 만들어서 쓰레기 포스팅을 막아내고 있다는 느낌도 듭니다. 그러나 인플루언서 글들도 대부분이 제품 홍보 리뷰들이 많다는 점은 안 비밀입니다. 

몇몇 기능은 좋으나 전체적인 답변 신뢰도가 낮은 빙 AI 검색

빙 검색의 챗GPT 기반 채팅 서비스

빙 AI 검색이 좋았던 점은 스마트폰 시장 점유율을 알려달라고 하니 텍스트로 알려주기에 

빙 검색의 챗GPT 기반 채팅 서비스

표로 보여달라고 하니 이렇게 표로 보여줍니다. 신기하죠. 질문 이해도도 좋고 좋은 점은 많지만 정보 출처 중에 오염된 출처가 너무 많다 보니 검색 결과도 오염되어 있네요. 따라서 제품 추천 같은 질문은 하지 마세요. 거의 대부분의 글이 대가성 리뷰 글입니다. 특히 쿠팡 파트너스 글이 너무 많아요. 

빙 검색의 챗GPT 기반 채팅 서비스

그러나 정동진 1박 2일 여행 짜 달라고 했더니 목적과 어디서 잘 거냐고 묻기에 대답을 했더니 저렇게 짜주네요. 좀 더 발전하면 알아서 예약하고 안내까지 자세히 하겠네요. 

그러나 초기라서 그런지 만족도는 높지 못합니다. 재미있는 건 멍청하다고 말하지 바로 질문을 닫아 버리는 성격 기능도 있습니다. 이 AI 기반 검색 서비스는 이제 시작입니다. 따라서 1년 후에는 이런 문제점을 해결한 보다 뛰어난 검색 서비스가 될 것입니다. 

문제는 출처가 신뢰도가 낮은 정보들이 많다는 점입니다. 그리고 기존 블로그나 뉴스, 웹문서의 글 중에서 필요한 내용만 쏙 빼서 소개하면 블로거들의 주 수익원인 애드센스나 네이버 애드포스트 광고를 보지도 누르지도 못합니다. 그럼 블로거들의 수익은 뚝 떨어지게 됩니다. 그럼 누가 블로그 운영하려고 할까요? 수익 바라지 않고 운영하는 분들 제외하고 수익을 목적으로 한 블로거들이 대거 사라지고 챗GPT를 돌려서 자동 포스팅하는 블로그만 가득하면 검색 시장 전체에 악영향을 줄 듯합니다. 

당장은 구글이나 네이버나 다음의 검색 시장을 크게 위협하지 않겠지만 3년 후에 신뢰도가 높아지면 큰 변화를 일으킬 듯 합니다. 다만 기존의 검색 서비스가 사라지는 것은 아니고 간단한 팩트 체크용으로만 사용되고 좀 더 심도 높은 내용이나 칼럼은 기존 검색엔진을 통해서 봐야 해서 공존할 듯하네요. 

반응형