본문 바로가기
IT/구글

유튜브 자동 자막 서비스와 자동 번역 기술이 더욱 정밀해진다

by 썬도그 2017. 2. 28.
반응형

네이버TV와 카카오TV가 유튜브를 타도하겠다고 소리에 풉하고 웃어버렸습니다. 유튜브가 유명 연예인이나 몇 안 되는 잘 나가는 BJ를 모신다고 해서 따라 잡힐 서비스가 아닙니다. 특히 카카오TV는 서비스 품질도 조악하고 여러가지 버그에 사용자 편의를 전혀 고려하지 않는 UI와 무성의함으로 욕을 엄청 먹고 있습니다.

동영상 서비스가 몇 안되는 연예인과 BJ로 인기를 끌 수 있습니다. 그러나 그것만 가지고 유튜브라는 거대한 탑을 뛰어 넘을 수는 없습니다. 유튜브가 인기 있는 이유는 그 몇 안되는 소수의 셀럽들 영향도 있지만 그보다 더 큰 거대한 롱테일인 일반인들이나 다양한 채널 다양한 콘텐츠 제작자들이 만드는 우주 같은 다양하고 풍부한 동영상 덕분입니다. 

특히, 해외 자료는 유튜브가 독보적이죠. 영어 울렁증이나 영어가 약한 분들에게는 해외 자료가 무용지물이라고요?
아닙니다. 유튜브는 자막 서비스를 지원합니다. 물론, 모든 동영상에 자막 서비스를 하는 것은 아니고 자막을 입혀야 볼 수 있기에 누군가가 자막 번역을 한 후 영상에 입히는 과정을 해줘야 합니다. 따라서 제대로 된 자막 번역 서비스가 제공되는 유튜브 동영상은 많이 없죠.

그러나 유튜브는 뛰어난 음성 인식 기술로 음성을 바로 영어 자막으로 만들고 이 영어 자막을 구글의 AI를 이용한 최신 번역 기술로 한국어로 번역을 할 수 있습니다. 


유튜브 자막 설정 방법

아직도 유튜브 자막 서비스를 잘 모르는 분들이 많아서 좀 설명을 하겠습니다. 유튜브 영상 하단 메뉴바에 보면 톱니바퀴 모양의 아이콘이 있습니다. 여길 누르면 자동재생, 특수효과 등등의 메뉴가 있습니다. 이중에서 자막이라는 메뉴가 있습니다. 여기에 사용 안함으로 되어 있으면 사용 안함을 클릭해서 들어가세요


사용 안함을 영어로 바꾸면 영어 자막이 뜹니다. 영어 자막이 삽입된 유튜브 동영상이면 영어라고 나옵니다. 영어 자막이 입혀진 영상이 아니면 위 이미지처럼 영어(자동 생성됨)이라고 나옵니다. 

자동 생성됨은 TTL 기술을 이용해서 음성을 인식한 후 바로 텍스트(자막)으로 뿌려주는 기능입니다.
우리가 음성으로 검색하는 것도 다  TTL 기술을 이용한 것이죠. 

이 자동 생성된 영문 자막을 자동 번역에 체크를 하면 한국어로 바로 번역이 됩니다. 



그러나 번역 품질이 조악하죠.  최근 구글은 문장을 통째로 번역하는 신경망 번역 기술인 GNMT 기술을 접목했습니다. 이 새로운 구글 번역은 인공 지능을 이용해서 기계학습을 통해서 스스로 번역 품질을 높여가고 있습니다. 이 새로운 구글 번역 기술은 유튜브의 자막 번역까지 적용되고 있지 않습니다. 그러나 곧 이 신경망 번역인 GNMT기술이 유튜브 자막 번역에도 적용될 것으로 보입니다. 


유튜브의 자막 기능이 더욱 정밀해진다.

유튜브 공식 블로그는 동영상 음성을 바로 자막으로 입혀주는 자동 자막 동영상이 10억 개를 넘었다고 발표했습니다. 이 자동 자막 서비스는 소리를 들을 수 없는 청각 장애자 분들과 영어를 공부하는 분들에게 큰 도움이 되고 있습니다. 

이 자막 기능은 2006년 처음으로 시작되었고 2009년에 자동 자막 서비스가 시작되었습니다. 그리고 7년이 지났습니다. 지난 7년 동안 자동 자막이 붙은 동영상은 10억 개가 넘었고 1일 시청하는 자동 자막 동영상은 1,500만 개를 돌파했습니다.  동영상에서 나오는 말 소리를 자막(텍스트)로 변환해주는 것은 구글 음성 인식 기술입니다.

제가 경험한 음성 인식 기능 중 최고는 구글입니다. 다음도 괜찮긴 한데 구글 보다는 못합니다. 
초기 자동 자막 서비스는 조악했습니다. 그러나 최근 자동 자막 서비스는 기계학습 기술이 접목되고 사용자 커뮤니티의 의견 등을 통해서 초기보다 정확도가 50%가 증가했습니다.


예를 들어서 예전에는  Youtube를 you로 인식했습니다. 

그러나 AI의 기계학습 기능이 추가된 유튜브 자동 자막 기술은 you가 아닌 정확하게 Youtube로 인식을 합니다. 그럼에도 아직 갈길이 멀고 사용할만하다라고 느낄 정도는 아닙니다. 그러나 신경망 기계학습은 시간이 지날수록 정확도가 높아지기 때문에 1~2년 안에 거대한 발전이 일어날 듯 합니다.

또한, 한글 번역 기능도 신경망 기계학습 번역 기술이 접목되면 엄청난 발전이 일어날 것입니다. 작년 연말 구글코리아에서 들은 새로운 구글 번역 서비스에 대한 이야기를 들어보니 조만간 유튜브에도 신경망 번역 기술이 들어갈 것이라고 하는데 그 조만간이 정말 조만간이 되었네요.  유튜브는 신경망 번역 기술을 접목한 서비스를 곧 선보일 예정입니다.

새로운 유튜브 자동 번역 서비스를 제공하는 언어는 영어, 프랑스어, 네덜란드어, 독일어, 이탈리아어, 일본어, 한국어, 포르투칼어, 러시아, 스페인어 총 10개 언어를 제공할 예정입니다. 흥미로운 것은 한국어를 제공하는 이유는 한국어 사용자가 많아서가 아닌 일본어와 문장 구조가 비슷해서 같이 서비스 하고 있다고 하네요. 구글 번역에서 영어와 일본어 사이에 번역율이 엄청 높은 이유는 일본 사용자들의 도움 덕분입니다. 

일본은 매뉴얼의 나라답게 일본어와 영어 번역 사이에 구글 번역이 매끄럽지 못하면 커뮤니티들이 지적을 하고 수정을 요합니다. 이 문화가 엄청 발달해서 일본어와 영어 번역은 매끄럽습니다. 아시는 분은 아시겠지만 일본어와 한국어 번역 정확도는 90%가 넘습니다. 따라서 일본어와 영어 사이에 번역 정확도가 좋아지면 영어와 한국어 번역 정확도도 좋아집니다. 

따라서 일본어를 지원하면 한국어도 같이 서비스를 제공하네요. 유튜브가 새로운 번역 기술을 접목한 자막 서비스를 시작해서 영어로 블라블라 하는 영어나 외국 콘텐츠들이 한국인들이 즐겨 듣기 시작하면 네이버TV와 카카오TV는 유튜브를 절대로 따라갈 수 없을 것입니다. 

반응형