본문 바로가기
IT/구글

인공지능 개발팀 구글 브레인팀의 2017년 인공지능 연구 성과들

by 썬도그 2018. 1. 16.
반응형

세계 최고의 인공지능 개발 회사는 구글입니다. 구글의 인공지능은 우리 실생활에 큰 도움을 주고 있습니다. 대표적인 것이 구글 번역과 구글 포토입니다. 구글이 번역 기술에 인공지능을 투입하면서 번역의 질이 아주 좋아졌습니다. 구글 포토는 뛰어난 얼굴 인식과 사물 인식으로 내가 촬영한 사진 중에 특정 사물 이름과 사람 이름을 넣으면 자기가 알아서 이미지를 찾아줍니다.

구글에서 인공 지능(AI)를 개발하는 팀은 구글 브레인(Google Brain)이 2017년 인공지능 기술 발전에 대한 보고서를 블로그에 소개했습니다.

https://research.googleblog.com/2018/01/the-google-brain-team-looking-back-on.html

이 내용을 소개합니다.

구글 브레인의 수석 연구원인 제프 딘은 기계 학습 분야에서 새로운 문제를 해결하기 위해서 기계 학습 기술을 고도화하는 것을 목표로 2017년 한 해 연구를 했습니다. 


1. AutoML

AutoML은 이미지 분류 및 물체 검출에 활용되는 기술입니다. 우리가 구글 포토에서 볼 수 있는 기술로 내가 백업한 사진 중에 '자전거'라고 검색하면 자전거 사진만 보여주는 기술이빈다. 이 AutoML은 강화 학습과 진화 알고리즘을 모두 사용해서 새로운 신경망 구조를 디자인 했습니다. 이 기술로 인해 자동 이미지 분류 기술은 더 개선되었습니다. 





2. 연설의 이해와 생성

인간의 말을 이해하고 대화를 할 수 있는 능력은 인공지능에게는 아주 중요한 과제입니다. 구글은 앤드 투 앤드 접근 방식을 이용한 음성 인식 기술을 개발해서 음성 인식 시스템의 인식 오류를 16%나 감소 시켰습니다. 

또한 구글은 기계 인식 팀과 협력하여 만들어내는 음성의 질을 획기적으로 개선하는 텍스트-음성 변환 방법도 개발에 성공했습니다. 쉽게 말하면 텍스트를 입력해서 그걸 말로 읽어주는 기계음을 좀 더 사람의 목소리에 가깝게 바꾸었습니다. 기존의 음성 생성 시스템의 mean option score(MOS)가 4.34인데 반해 개선된 모델로 MOS가 4.53으로 올라갔습니다. 전문 내레이터의 MOS가 4.58이므로 전문 내레이터의 인간 음성과 말투에 한걸음 더 가까워졌습니다. 나중에는 인간의 목소리인지 기계의 목소리인지 구분도 못하겠네요. 내레이터 분들에게는 안 좋은 소식입니다.


3. 새로운 기계 학습 알고리즘과 접근


구글 브레인팀은 기계 학습과 새로운 알고리즘 접근법을 개발하는 작업을 2017년 내내 했습니다. 새로운 멀티 도달 모델과 , 주의 기반 메커니즘과 새로운 강화 학습을 개발했습니다.


4. 개인 정보 보호 및 보안

개인 정보 보호 및 보안을 강화하기 위해 구글 브레인은 기계 학습을 활용하려고 하고 있습니다. 기계 학습 기법을 적용해서 개인 정보 보호를 강하하고 있습니다.


5. 기계 학습에 대한 깊은 이해

기게 학습 기능이 중요하다고 알고 있는 구글 브레인팀은 기계 학습에 대한 기초적인 연구도 적극적으로 하고 있습니다.

구글 브레인팀은 기계 학습 전문 저널 Distill의 출시에 참여하고 있습니다. 2018년에는 더 많은 연구 성과가 발표 될 예정입니다.



6. 기계 학습을 위한 오픈 데이터 세트 

기계 학습을 위한 MNIST, CIFAR-1, ImageNet, SVHN, WMT의 오픈 데이터 세트가 기계 학습을 크게 발전시켜 왔습니다. 구글 브레인과 구글 리서치는 1년의 연구 끝에 얻어진 데이터 세트를 오픈소스화 하기 위해서 노력하고 있습니다. 

· YouTube-8M : 4716 클래스 700 만 이상의 YouTube 동영상
· YouTube-Bounding Boxes : 21 만개의 YouTube 동영상에서 500 만개의 구형
· Speech Commands Datase : 수천 개의 스피커 짧은 음성 명령
· AudioSet : 200 만개의 YouTube 동영상에서 527 종류의 사운드 이벤트
· Atomic Visual Actions (AVA) : 5 만 5000 개의 비디오 클립에서 표시된 21 만 액션
· Open Images : 6000 클래스에 표시된 900 만장의 포토 Commons License의 사진
· Open Images with Bounding Boxes : 600 클래스로 구성된 120 만 구형


7. TensorFlow

2015년 2세대 기계 학습 프레임 워크인 TensorFlow가 오픈소스화 되었습니다. 2017년 2월에는 TensorFlow1.0을 11월에는 TensorFlow v1.4가 출시되었습니다. 2017년 2월에는 처음으로 TensorFlow 개발자 회의를 개최하고 450명의 개발자가 구글 본사에 모여서 회으를 했습니다. 2018년 3월 30일에는 TensorFlow 개발자 서밋을 개최할 예정입니다.


8. TPUs

5년 전에 딥 러닝을 위한 하드웨어 구조를 바꿀 필요성을 인식한 구글 브레인팀은 전용 ASIC칩을 탑재한 머신 Tensor Processing Unit(TPU)를 개발에 착수해서 1세대 TPU를 완성시켰습니다. 2017년 2월에는 2세대 TPU를 발표했습니다. 이는 GPU와 CPU보다 30배는 높은 성능을 가졌습니다. ResNet-50 ImageNet 모델에 대한 교육은 기존의 워크 스테이션으로는 며칠 걸리던 것을 2세대 TPU를 사용해서 불과 22분 만에 완료 했습니다. 

이 내용은 1부의 내용으로 2부에서는 의료, 로봇, 과학 분야에서의 구글 브레인팀의 성과를 소개를 담고 있습니다. 이는 다음에 소개하겠습니다. 

반응형