관리 메뉴

사진은 권력이다

내 목소리 대신 인공 지능 목소리를 넣어보자 네이버 더빙 추천 본문

IT/가젯/IT월드

내 목소리 대신 인공 지능 목소리를 넣어보자 네이버 더빙 추천

썬도그 2020. 7. 21. 10:02
반응형

유튜브를 운영한 지 12년이 넘어가네요. 2007년 이 블로그를 운영하기 시작해서 2008년 첫 유튜브 계정을 열고 동영상을 업로드했습니다. 당시는 유튜브는 블로그에서 담을 수 없는 영상 정보를 담는 블로그 보조 수단이었습니다. 당시는 지금 같이 유튜브 광풍이 불었던 시기도 아니고 대부분의 콘텐츠가 방송 영화 분할 업로드 영상들이나 노래를 담은 영상들이 많았습니다. 직업을 대체할 정도의 수익을 내는 유튜버도 거의 없었습니다.

12년이 지난 지금 유튜브는 공중파를 위협할 정도로 큰 영상 매체가 되었습니다. 유튜브는 쓰레가 같은 영상물도 많지만 양질의 콘텐츠 그것도 다양한 콘텐츠가 매일 같이 올라옵니다. 특히나 실력이나 아이디어가 너무 뛰어나서 방송국 놈들(?)을 넘어서는 콘텐츠를 만드는 프로 유튜버들도 늘고 있습니다.

너도나도 유튜브를 하고 있습니다. 그러나 전 아직까지도 전문적인 정보를 올리는 유튜브 채널을 운영하고 있지 않습니다. 이러니 12년 운영해서 이제 겨우 1천 명 구독자를 넘어섰습니다. 더 문제는 유튜브에 광고를 달려면 2가지 조건이 있습니다. 

1천 명 구독자, 1년 누적 시청 4천 시간

1천명 구독자는 넘긴 지 몇 개월이 지났지만 1년 4천 시간 시청은 좀처럼 넘기기 쉽지 않습니다. 4천 시간 시청 시간을 넘기려면 열혈 구독자가 많아야 하고 무엇보다 영상이 재미있어야 합니다. 그래야 진득하게 지켜봅니다. 지금까지 제 유튜브 채널에는 중구난방 주제의 영상을 올렸습니다. 이러니 구독자는 1천 명이 넘었어도 열혈 구독자도 거의 없고 저 조차도 이런 채널을 누가 구독해라는 생각까지 하네요. 

그러나 이렇게 운영해서는 안 되겠다 생각이 들었습니다. 게다가 최근에 올린 이케아 여름 세일 영상이 구글 알고리즘 파도를 타면서 대박이 났습니다. 단숨에 4천 시간이 돌파가 되었고 드디어 유튜브에 광고를 붙일 수 있게 되었습니다. 

이 유튜브 광고 수익을 내는 건 처음이 아닙니다. 이전에도 한 달에 1만 원 안 되는 수익을 냈다가 해외 유명 유튜버가 일본에서 허튼짓을 하는 바람에 1천 명 구독자 1년 시청 누적 시간 4천 시간의 제약이 생겼습니다. 이 제약을 한 3년 만에 뚫었네요. 

제대로 유튜브 영상 콘텐츠를 만들어보자고 생각을 했습니다. 그래서 저작권 기간이 만료된 클래식 사진작가들을 소개하는 영상을 만들 생각을 했습니다. 그런데 영상에 사진과 자막에 음악만 입혀서 내보내기에는 밍밍할 것 같아서 목소리 녹음을 생각했습니다. 그러나 제 목소리 제가 압니다. 듣기 거북한 것은 아니지만 매혹적이지도 않습니다. 특히 발음이 명확하지 않아서 전달력도 떨어집니다. 그래서 요즘은 잘 생긴 사람보다 목소리 좋은 사람이 참 부럽습니다. 

AI 더빙 서비스 네이버 클로바 더빙 (CLOVA Dubbing)

<타입캐스트>

내 목소리 대신에 다른 사람의 목소리를 입힐 수 있습니다. 그러나 돈이 들죠. 그래서 요즘 저와 같은 고민을 가진 분들이 고마워하는 서비스가 인공지능 더빙 서비스입니다. 쉽게 말해서 TTS 서비스의 진화 버전이라고 할 수 있습니다. 요즘 TTS 서비스는 인간 목소리인지 기계 목소리인지 구분하기 쉽지 않을 정도로 정교해졌습니다. 

요즘 많은 유튜브 정보 채널들이 사용하는 목소리가 유튜버 목소리도 있지만 기계음 즉 인공지능(AI) 목소리를 이용한 채널이 많을 정도로 사용량이 많아지고 있습니다. 인공지능 더빙 서비스는 뭐가 있을까요? 국내에서는 2개의 서비스가 가장 유명합니다. 하나는 네오사피엔스의 타입캐스트와 네이버의 클로바 더빙입니다. 

타입캐스트는 정말 아주 다양한 인공지능 목소리를 이용할 수 있는 점이 강점입니다. 최근에 유료 서비스로 전환을 해서 제대로 사용하려면 돈을 내고 사용해야 합니다. 

월 최대 3,000자 까지는 무료이지만 그 이상은 유료입니다. 문제는 이 3,000자가 생각보다 양이 너무 적습니다. 매달 10개 이상의 영상을 업로드 하는 분들은 천상 유료 서비스를 이용해야 합니다. 

https://typecast.ai/

 

typecast

타입캐스트는 인공지능 딥러닝 기술을 활용해 특정인의 목소리 스타일, 특징 등을 학습하여 누구든지 개성과 감성이 담긴 오디오 컨텐츠를 생성할 수 있는 서비스입니다.

typecast.ai

무료이면서 무제한으로 사용할 수 있는 서비스가 바로 네이버 클로바 더빙입니다. 

기업이나 학교, 병원 같은 단체나 기업은 무료 사용 신청을 해야 하고 개인은 무료입니다. 

처음에는 큰 기대를 하지 않았습니다. 얼마나 좋겠어?라는 생각을 했죠. 그런데 네이버 클로바 더빙 생각보다 아주 좋습니다. 먼저 사용 편의성이 아주 뛰어납니다. 동영상을 올려 놓고 영상을 보면서 텍스트를 쳐서 더빙에 추가하면 음성 파일을 만들어주는 방법이 있지만 그냥 텍스트를 쭉 쳐서 더빙에 추가해서 사용할 수도 있습니다. 

먼저 상단에서 목소리를 선택합니다. 

목소리는 4명만 있는 줄 알았는데 오른쪽 상단 전체보기를 누르니 더 많이 나오네요. 심지어 일본어, 중국어, 스페인어 더빙도 있네요. 물론 타입캐스트보다는 종류가 다양하지 않습니다. 

클로바 더빙 사용법은 간단합니다. 상단에 텍스트를 입력합니다. 텍스트는 무제한 입력이 가능한 것은 아니고 최대 200자까지 가능합니다. 다 입력한 후 미리듣기로 목소리와 발음을 체크합니다. 이때 발음이 어색한 부분은 수정합니다. 

예를 들어 10장을 우리는 열장으로 읽지만 인공지능 더빙 서비스인 클로바 더빙은 십장으로 읽습니다. 부자연스럽죠. 이런 부분은 그냥 열장이라고 한글로 적어주는 것이 좋습니다. 이렇게 음성 발음을 확인한 후 이상이 없으면 더빙 추가를 눌러주면 하단에 더빙이 추가됩니다. 하단 타임라인 길이는 - / + 부분을 조절하면 타임라인 길이를 조절할 수 있습니다. 

더빙 추가를 한 후에 내용을 수정하고 싶으면 수정하고 싶은 음성 파일 위에 재생바를  놓고 우클릭해서 메뉴중에 편집을 누르면 편집이 가능합니다. 아니면 더빙 목록 편집을 눌러서 편집할 수도 있습니다. 

반응형

더빙 목록 편집을 누르니 보다 간편하게 수정이 가능하고 삭제도 편리하네요. 편집이 끝난 후에는 프로젝트는 저장할 수 있고 언제든지 다시 꺼내서 수정하거나 다운로드 받을 수 있습니다. 

다운로드는 하단 오른쪽에 아주 큼직하게 떠 있습니다. 다운로드를 하면 압축 파일이 내려 받아집니다. 

각 음성 파일은 개별 음성 파일로 저장이 됩니다. 아주 좋네요. 상단에 출처표기 가이드가 있네요. 

출처 표기 가이드네요. 워터마크를 넣어서 표기하는 방법이나 자막으로 '이 영상에는 클로바 더빙으로 제작한 AI 보이스가 포함되어 있습니다'라고 표기를 해주는 방식이네요. 출처 표기도 표기지만 내 목소리가 아니면 아니라고 시청자들에게 알려주는 것이 예의입니다. 

이렇게 다운로드 받은 음성 파일은 내가 잘 사용하는 동영상 편집기에서 넣어서 사용하면 됩니다. 

youtu.be/LZbjA8244ag

youtu.be/LM__DDi_qYI

네이버 클로바 더빙으로 제작한 영상 2개입니다. 앞으로 클래식 사진작가 소개를 담은 영상을 꾸준히 만들어볼 생각입니다. 

https://clovadubbing.naver.com/

 

클로바더빙

 

clovadubbing.naver.com

클로바 더빙이 아쉬운 점은 띄어읽기가 되지 않고 띄어읽기 시간을 조절하는 기능이 없다는 것은 아쉽네요. 한가지 팁을 드리자면 마침표를 찍으면 좀 띄어서 읽으니 띄어서 읽어야 할 부분에 마침표를 찍어주면 됩니다. 생각보다 매끄러운 인공지능 음성에 매료되어서 앞으로 클로바 더빙을 애용할 예정입니다. 

반응형
그리드형
3 Comments
댓글쓰기 폼