IT/IT월드

유튜브 주소를 입력하면 2인 팟캐스트 음성으로 만들어주는 구글 노트북 LM에 놀라다

썬도그 2025. 5. 2. 11:06
반응형

STT, TTS를 구분할 줄 아는 분이라면 AI를 잘 활용하는 분이라는 판단이 습니다. 왜냐하면 이 둘은 현재 AI로 생산하는 콘텐츠에서 아주 중요한 역할을 합니다. STT는 말을 텍스트로 변환해 주는 기술로 자동 자막 형성에 사용하며 TTS는 오래된 기술이지만 최근 AI에 의해 보다 자연스러워진 텍스트를 말로 변환해 주는 인공 성우 역할을 합니다. 

유튜브 영상을 요약해서 2인 대화식 팟 캐스트로 만들어주는 구글 노트북 LM

구글 노트북 LM

오픈 AI가 AI 서비스를 가장 잘한다고 생각하지만 구글은 다양한 AI 서비스를 선보이고 있어서 다양성에서는 구글이 더 낫습니다. 

구글은 노트북 LM을 선보였습니다. 마인드맵이나 문서 및 논문 분석을 도와주는 서비스입니다. 복잡한 정보를 이해하기 편한 탐색 도구입니다. 

구글 노트북 LM

예를 들어서 논문이 담긴 PDF 파일이나 영문 자료가 올라온 URL을 입력한 후에 그 긴 내용을 다 읽을 수 없을 때 그냥 URL을 업로드한 후 그 내용을 AI와 채팅하면서 알아가는 것이죠. 

 

그런데 이 구글 노트북LM이 업그레이드를 하면서 한국어 음성 요약 서비스를 시작했습니다. 사용하면서 이게 가능한가 할 정도로 엄청난 기능이네요. 

먼저 이걸 들어보세요. 두 AI 음성대화인데 말 안 하면 그냥 팟 캐스트로 이해하실 겁니다. 실제로 너무 자연스러워서 깜짝 놀랐네요. 그럼 이건 어떻게 만들었냐?

 

 

바로 위 영상 링크를 넣어서 한 5분 만에 만든 내용입니다. 영어로 된 TED 강연으로 15분짜리 강연입니다. 이걸 구글 노트북 LM에 넣으면 한 5~10분 사이에 5분짜리 짧은 AI 음성 팟캐스트를 만들어 줍니다. 그럼 이게 왜 필요하냐? 시간 때문입니다. 이동하면서 15분짜리 영상 보는 게 낫긴 하죠. 그런데 운전하면서 듣거나 작업하면서 내 업무에 관련된 정보를 얻고 싶을 때는 라디오나 팟캐스트가 최고입니다. 

 

저는 경제관련 라디오 방송 팟캐스트를 산책하면서 듣습니다. 그걸 통해서 최신 AI 기술과 IT 기술과 요즘 트렌드와 경제 트렌드를 듣죠. 운동이나 산책하면서 들을 수 있기에 아주 편리합니다. 그럼 환각현상이 없냐? 있긴 합니다. 있긴 한데 영상이나 텍스트에 없는 내용을 추가하긴 하는데 그 내용이 오히려 더 유용하고 팩트에 가까워서 좀 놀라기도 합니다. 물론 오류도 있죠. 그럼에도 대체적으로 꽤 영상 및 텍스트 요약을 아주 잘 해주네요. 

 

구글 노트북 LM 사용법

구글 노트북 LM

사용법은 아주 간단합니다. 구글 노트북LM은 문서, 웹사이트, 유튜브에서 소스를 공급받을 수 있습니다. 유튜브나 웹사이트는 링크를 통해서 업로드가 가능합니다. 

구글 노트북 LM

 

유튜브를 선택하고 유튜브 링크를  넣어줍니다. 

 

구글 노트북 LM

그럼 가운데에 요약본이 나옵니다. 그리고 하단에 입력창이 있는데 영상 내용을 보고 채팅을 묻고 답할 수 있습니다. 

그리고 오른쪽에 AI 음성 개요가 있는데 여기서 생성을 누르면 영상 내용을 5분 내외의 짧은 팟캐스트 음성 대화로 만들어 줍니다. 맞춤 설정을 통해서 어떤 정보에 좀 더 가중치를 올릴 수 있습니다. 

 

카메라 정보 팟캐스트를 음성 팟캐스트로 만들어보다

구글 노트북 LM

 

페타픽셀은 카메라 정보 사이트로 아주 유명하죠. 여기에 올라온 캐논 R50 V 기사를 넣어봤습니다. 

 

캐논 R50 V가 전자식 선막 셔터라는 기계식 셔터가 있어서 롤링 셔터로 인한 젤리처럼 휘는  젤로 현상이 없다는 말에 깜짝 놀랐네요. 이 내용은 원문 글에 간단하게 소개했는데 이걸 좀 더 쉽게 이해할 수 있게 설명하고 있네요. 순간 이걸로 카메라 팟 캐스트 만들어도 되겠다는 생각이 들었습니다. 

 

너무 좋은데요. 팟 캐스트 내용은 2명의 화자가 제가 제공한 페타픽셀 웹 문서를 다 읽어보고 대화를 하는 내용입니다. 그래서 수시로 문서에 따르면 내용에 따르면이라는 소리가 나와요. 여기에 가끔 추가 설명이나 재미있는 말도 넣어주네요. 그리고 시작할까요? 이상으로 마치겠습니다 등 설명 안 하고 들으면 카메라 관련 두 전문가의 대화로 알겠습니다. 

 

구글 노트북LM은 영어 영상으로 공부하는 학생과 연구자들에게 좋다.

공부를 하고 싶은데 국내에는 관련 영상도 글도 없으면 우리는 영문으로 된 자료나 영상을 보죠. 그러나 영어 모르는 분들은 자막을 생성해서 봅니다. 이제는 번역의 벽도 거의 허물어졌어요. 그런데 이걸 음성 팟캐스트로 듣는다? 눈 감고 지하철에서 영어 동영상을 음성 팟캐스트로 듣는다? 놀랄 노짜네요. 

 

환각 현상이 약간 있습니다. 자기가 아는 정보 분야부터 테스트 해보시고 환각 현상이 어느 정도인지 파악하고 사용해 보시길 바랍니다. 전 너무 좋네요. 

 

https://notebooklm.google.com/

 

로그인 - Google 계정

이메일 또는 휴대전화

accounts.google.com

위 링크를 눌러서 들어가 보세요

반응형