본문 바로가기
카메라사진/사진에관한글

인공지능 딥 러닝 기술로 만든 구글의 가상 사진작가

by 썬도그 2017. 7. 16.
반응형

인공지능은 언젠가 인간의 지능을 뛰어 넘어서 인간이 이해할 수 없는 지능을 가진 존재가 될 것입니다. 그러나 인공지능은 추론이 약해서 창의적인 일 보다는 계산을 좀 더 빨리 하는 능력이 좋아서 정답이 있는  수치에 관련된 지능 쪽에서 큰 역할을 할 것으로 보입니다. 

그러나 최근에는 인공지능이 기계 학습과 같은 스스로 학습하는 능력을 갖추면서 인공 지능의 큰 발전이 일어나고 있습니다. 이전에는 인간이라는 선생님이 알려 준 지식만 달달 외우던 암기 학습이었다면 기계 학습(머신 러닝)은 혼자 독학으로 지식을 쌓는 자기 주도 학습이라서 지능의 발전 속도가 무척 빠릅니다. 여기에 신경망 기술을 이용한 딥 러닝 등을 통해서 스스로 사물을 인지하는 시대가 되었습니다. 

최근에는 인간만 할 수 있다는 추론도 가능한 인공지능이 나와서 사람들을 놀라게 하고 있습니다. 추론 같은 경우는 창의성과 연관이 되어 있고 창의력이 많이 필요로 하는 예술가들이 많이 가지고 있는 능력인데 인공지능이 추론까지 하게 되면 예술 분야도 인공지능과 함께 경쟁을 하는 시대가 올지도 모르겠네요. 그런데 사진작가를 위협하는 일이 실제로 벌어졌습니다. 



멋진 풍경이 있는 곳에서 사진작가가  촬영한 풍경 사진 같습니다. 그런데 이 사진 구글 스트리트뷰라는 360도 파노라마 사진서비스에서 가장 아름답다고 판단된 부분을 크롭한 후에 색조와 노출 및 HDR 기술까지 사용해서 만든 사진입니다. 놀라운 것은 이 작업을 사람이 아닌 딥 러닝 기술을 이용한 인공지능이 만든 사진입니다.

인공지능이 스스로 학습을 하는 기계 학습은 많은 분야에서 큰 활약이 예상되고 있습니다. 인공지능은 위에서도 말했지만 정답이 있는 분야에서 큰 활약을 합니다. 그러나 정답과 같은 객관적인 답이 있는 분야가 아닌 예술과 같은 주관이 개입되는 분야에서는 인공지능의 활용도가 크게 떨어집니다. 아아무래도 주관이 개입되는 평가, 토론, 논쟁, 언쟁은 의견만 개진하는 곳에서는 인공지능이 아무리 뛰어난 말을 해도 그냥 하나의 주관이자 하나의 의견일 뿐입니다. 예를 들어 아름다운 사진을 보고 누군가는 별로라고 하지만 누군가는 정말 아름다운 사진이라고 합니다. 

이렇게 예술에 대한 감상평이나 아름다움에 대한 기준은 각자 다르기 때문에 서로의 감상을 교환할 뿐 정답을 낼 수 없습니다. 그럼에도 보편적인 아름다움이 있습니다. 10명이 봐서 과반 이상이 좋다고 하는 사진이나 그림은 보편적인 아름다움이 있다고 할 수 있죠. 

따라서 아름다움 또는 미학도 수치화 할 수 있지 않을까 하는 생각도 듭니다. 이런 생각을 저만 한 것은 아닌가 봅니다. 구글은 인공지능에게 아름다운 사진을 만들어 보라고 지시를 했고 이에 인공지능은 위의 사진처럼 보편적으로 아름답다고 느낀 사진을 만들어 냈습니다. 


인공지능 딥 러닝 기술로 만든 구글의 가상 사진작가

구글은 가상 사진작가라는 개념을 만들었습니다. 구글은 예술적으로 느껴지지는 콘텐츠를 인간이 아닌 인공지능이 만드는 시스템을 테스트하고 있습니다. 이 아이디어는 사진작가들의 '워크플로우'를 모방하는 것에서 시작되었습니다. 

구글의 가상 사진작가는 인공지능이 달력 사진 같은 아름다운 풍경 사진을 만들어 냅니다. 사람이 아니기에 출사를 가서 사진을 찍을 수는 없고 구글 스트리트뷰라는 360도 파노라마 사진 지도 서비스의 사진을 쭉 살펴 보다가 아름다운 장소를 선택합니다. 그게 바로 (a)사진입니다. (b)는 (a)에서 고른 사진을 적절한 구도로 트리밍을 합니다. (c)는 (b)에서 트리밍한 사진을 채도와 HDR 강도를 조절합니다. (d)는 (c)에 드라마틱 마스크를 추가합니다. 

구글 가상 사진작가는 시스템이 학습한 미학적인 요스를 스스로 학습하고 미학적으로 가치 있는 요소를 분석한 후 스스로 아름답다고 생각하는 요소별로 처리를 합니다. 솔직히 우리가 사진 찍을 때 활용하는 3분할이니 길잡이 선이니 뭐니 하는 그 사진 촬영 매뉴얼을 인공지능이 스스로 깨닫고 만들어갈 수 있습니다. 

그렇게 구글의 인공지능이 구글 스트리트뷰 사진에서 만들어낸 풍경 사진들입니다. 


<캐나다 재스퍼 국립공원>


<스위스 인터라켄>



<이탈리아 Park Parco delle Orobie Bergamasche>



<캐나다 재스퍼 국립공원>


제가 보기엔 꽤 괜찮은 사진들입니다. 아주 빼어나다고 할 수 없지만 아마추어에서 하이 아마추어 사이의 사진 같네요. 
구글은 인공지능인 가상 사진작가가 만들어낸 사진과 사람이 촬영한 사진을 섞어서 사진 전문가들에게 보여줬습니다. 그리고 그 사진들에게 평가를 부탁했습니다. 

평가는 4단계로 구분했습니다. 
1점 : 구도와 조명을 고려하지 않고 막 찍은 사진
2점 : 일반적으로 말하는 좋은 사진 그러나 주목할만한 점은 없는 사진
3점 : 세미 프로 수준의 사진
4점 : 프로 수준의 사진

으로 평가해 달라고 했습니다.



구글 가상 사진작가가 구글 스트리트뷰에서 만들어낸 사진을 본 사진전문가들의 평가를 보면 2.5에서 3.0 사이가 많습니다. 즉 저 같은 생활사진가들이 주로 많이 찍는 일반적으로 좋다고 느껴지나 임팩트가 없는 사진에서 세미 프로 수준의 사진을 만들어 냈네요. 좀 더 정확하게 말하면 사진전문가들이 구글 인공지능이 만들어낸 사진을 보고 사진전문가 40%가 구글 인공지능이 만들어낸 사진이 세미 프로 또는 프로 수준이라고 평가했습니다. 

대단한 성과 아닙니까? 인공지능이 사진을 찍지는 못하지만 사진을 셀렉팅하고 후보정하는 스킬이 꽤 뛰어납니다. 이런식이면 나중에는 저 같은 사람은 360도 카메라 머리에 달고 다닌 후 집에 와서 구글 가상 사진작가라는 인공지능에 맡기면 알아서 예쁜 풍경 사진 만들어 주겠네요.

사진 셀렉팅하는 것도 굉장히 힘든데 이걸 인공지능이 대신할 시대가 될 수도 있겠네요. 알쓸신잡에서 말했듯이 사진작가나 사진가들은 인공지능의 발전하면 많이 사자질 것이라고 합니다. 그 말이 헛소리가 아닐 수도 있겠네요.

출처 : https://research.googleblog.com/2017/07/using-deep-learning-to-create.html

반응형