본문 바로가기
IT/구글

구글 바드 사진 업로드 기능 추가! 이젠 이미지로 질문 할 수 있다

by 썬도그 2023. 9. 21.
반응형

챗GPT와 구글 바드의 등장 이후 블로그 세상은 큰 변화가 생겼습니다. 구글 바드나 챗GPT에 글을 써달라고 부탁하고 무한 자동 포스팅을 하는 사람들이 늘었습니다. 그 분야에 대한 지식이 거의 없어도 글을 AI가 써주는 세상이 되었네요. 그런데 이게 검색 서비스 품질을 낮출 수 있습니다. 왜냐하면 챗GPT와 구글 바드의 환각 현상 때문입니다. 

생성형 AI의 가장 큰 문제점은 팩트 체크를 제대로 못한다는 겁니다. 그래서 팩트 체크를 크로스체킹을 해줘야 합니다. 이는 부정확한 정보를 가지고 학습을 했기 때문이죠. 또한 정확한 정보로 학습을 해도 두루뭉수리한 화법 때문에 팩트를 왜곡하는 경우도 많습니다. 그래서 전 잘 쓰지 않습니다. 

문제는 이런 것도 체크 안하고 무한 포스팅을 지향하는 스팸 블로그가 엄청나게 늘어났다는 겁니다. 요즘 부업으로 챗GPT로 글 생성해서 하루에도 10~20개씩 블로그 글을 올리는 분들이 있습니다. 포스팅 제한에 걸리면 여러 블로그 만들어서 돌리기도 하고요. 문제는 그런 무지성, 무노력 글들이 검색 상위에 노출이 되면 그 검색 엔진은 신뢰도가 훅 떨어집니다. 이에 구글은 AI가 쓴 콘텐츠를 걸러내는 작업을 하고 있습니다. 

구글 바드 이미지 업로드 기능이 들어가다

구글 바드 사진 업로드 기능 추가

챗GPT와 구글 바드를 다 사용해 봤는데 구글 바드가 좀 더 좋습니다. 챗GPT는 타이핑 치듯 한 줄씩 나오는데 구글 바드는 한 방에 나옵니다. 다만 챗GPT는 다양한 확장 서비스들이 많은데 반해 구글 바드는 아직 없네요. 이런 구글 바드가 최근 업데이트를 통해서 이미지 업로드도 가능해졌네요. 

구글 바드 하단 텍스트 입력창 옆에 이미지 업로드 아이콘이 있네요. 여길 누르고 궁금한 이미지나 사진 올려서 다양한 질문을 할 수 있습니다. 예를 들어 이게 무슨 카메라냐고 물어보면 

구글 바드 사진 업로드 기능 추가

정확하게 대답을 합니다. 구글은 세계 최고의 이미지 인식 기술이 있는데 이걸 이용하나 보네요. 니콘 FM2이라고 잘 보여주네요. 심지어 판매량까지 안내해 주네요. 2010년에는 FM3A가 출시되었다는 소식도 알려주네요. 그러나 이 말은 거짓입니다.  2001년부터 2006까지 생산되었다가 단종된 카메라가 니콘 FM3A입니다. 여기서도 환각 현상이 있네요. 어쩔 수 없죠. 그럼에도 이게 무슨 카메라인지 정확하게 맞추네요. 

구글 바드 사진 업로드 기능 추가

이렇게 어떤 사물에 대한 궁금증이 생기면 이렇게 구글 바드에 올리면 바로 알려줍니다. 이전에도 구글 렌즈나 구글 이미지 검색이 있었지만 그 검색과 다른 점은 구글 바드는 자세히 설명까지 해줍니다. 여기서도 보면 최근 중고 시장에서 높은 인기를 끌고 있다고 하는데 이 최근은 2011년 전후겠죠. 이런 부분이 좀 아쉽죠. 

구글 바드 사진 업로드 기능 추가

카메라 이름은 잘 맞추는데 이 카메라 HD 동영상 못 찍고 SD까지만 가능해요. 이 사양을 틀리네요.  

구글 바드 사진 업로드 기능 추가

이번엔 이 유명한 흑백 사진에 대해서 물어 봤습니다. 전 이 사진 누가 찍었는지 무슨 의미가 있는지 사진 역사상에서 어떤 위치인지 잘 알죠. 

구글 바드 사진 업로드 기능 추가
구글 바드 사진 업로드 기능 추가

와 대단하네요. 정확합니다. 보니까 영어로 된 자료가 많은 걸 질문하면 대답의 정확도가 좀 더 높네요. 이거 그대로 교육 자료로 활용해도 좋겠어요. 

구글 바드 사진 업로드 기능 추가

다른 대답을 볼 수도 있고 음성으로 읽을 수도 있습니다. 

환각 현상은 여전히 있지만 외국 문서 이미지와 그래프까지 척척 대답해 주는 놀라운 구글 바드

구글 바드 사진 업로드 기능 추가

일본 카메라 공업 협회인 CIPA의 카메라 출고 그래프입니다. 자주 보는 데이터입니다. 그런데 한문과 일본어로 되어 있어서 무슨 말인지 잘 몰라서 초기에는 스마트폰으로 촬영해서 그걸 번역하기도 했습니다. 이미지이다 보니 구글 번역기가 작동을 안 합니다. 그런데 구글 바드에게 통으로 올려서 물어봤습니다. 

구글 바드 사진 업로드 기능 추가

이건 뭐 텍스트를 인식하고 이걸 번역해서 알려주는 이상이네요. 의미까지 파악해 줍니다. 그래프를 통해서 렌즈 교환식 카메라 시장이 지속적으로 축소되고 있다고 말하고 있네요. 그 이유를 스마트폰의 카메라 성능 향상 때문이라는 분석도 어느 정도 수긍이 가는 분석입니다. 

구글 바드 사진 업로드 기능 추가

이번엔 한국 출산율 그래프를 올리고 2040년 한국 인구를 예측해 보라고 했더니 2040년 5,086만 명이라고 하네요. 통계청 자료라고 하면서요. 하도 환각 현상이 많아서 크로스체킹해보니

구글 바드 사진 업로드 기능 추가

뭔가 맞는 것 같으면서도 좀 다르네요. 

구글 바드 사진 업로드 기능 추가

이번엔 영문 논문입니다. 

구글 바드 사진 업로드 기능 추가

와! 논문 내용을 아주 자세히 설명해주네요. 이거 맞아요. 환각 현상이 덜한 게 저 논문 텍스트를 번역한 후에 그 내용을 분석하고 정리하네요. 이 생성형 AI의 장점은 글을 정리하고 줄여주는 건 엄청 잘합니다. 5천 자 되는 글도 200자로 줄여줘라고 찰떡같이 만들어줍니다. 정말 글 정리와 줄이기는 인간 이상입니다. 

보세요 딱 3줄로 요약까지 해주잖아요. 여기서 나무 덮게는 나무가 만드는 그늘로 도심에 나무를 많이 심으면 나무 그늘이 많이 생기고 그로 인해 열섬 효과 줄이고 기온도 낮게하고 대기 질도 개선한다고 하네요. 

인물 사진은 인식도 대답도 못하는 구글 바드

구글 바드 사진 업로드 기능 추가

모든 사진을 인식하는데 유일하게 인식 못하는 건 인물 사진입니다. 아이유 사진 올려도 저렇게 인물 이미지 처리는 지원하지 않는다고 하네요. 이유는 개인신상정보이고 초상권 문제 때문에 데이터 학습을 못하는 것 같기도 합니다. 

구글 바드 사진 업로드 기능 추가

로버트 카파 사진들 알려 달라니까 텍스트를 넘어서 이미지까지 찾아주네요. 다만 모든 사진을 다 찾지는 못합니다. 

구글 바드 사진 업로드 기능 추가

좀 충격이네요. 이렇게 자료가 풍부한 데이터는 아주 깔끔하게 정리해서 보여주고 이미지까지 보여주네요. 모르는 이미지나 그래프도 논문도 캡처해서 올려서 정리 해달라고 하면 다 알려줍니다. 해외 논문 보면서 뭔 소리인가 짜증 났는데 이걸 깔끔하게 요약해서 알려주네요. 영문 논문이라고 해도  구글 번역 이용하면 내용은  대충 아는데 그게 뭔 소리인지는 번역으로는 모르잖아요. 그런데 그걸 구글 바드가 알려주네요. 

앞으로 환각 현상만 인지하고 좋은 내용만 잘 발라내서 사용해야겠습니다. 다시 말하지만 생성형 AI 중 텍스트 쪽은 추상화 작업 때문에 팩트 오류가 여전히 많아서 사용하려면 항상 크로스 체크를 해야 합니다. 이래서 다들 안 쓰나 보네요. 그럼에도 점점 진화를 하네요. 

반응형