본문 바로가기
IT/IT월드

동영상 제작자들에게 멘붕을 일으킨 오픈AI의 소라 동영상 제작 기술

by 썬도그 2024. 2. 17.
반응형

2023년에는 블로거들에게는 충격적인 한 해였습니다. 지금까지 블로그라는 플랫폼은 내가 직접 찍은 사진과 글로 포스팅을 했지만 2023년에는 오픈 AI의 챗GPT로 글을 만들고 그걸 대충 가공한 후 자기가 찍은 사진 1장 없이 무료 이미지나 이미지생성형 AI가 만든 이미지를 대충 넣어서 만든 자동 포스팅이 넘쳤습니다. 

 

그로 인해 블로그 전체 글의 품질을 대폭락을 합니다. 지금도 티스토리 포럼에서 왜 자꾸 애드센스 고시에서 탈락하냐고 하소연을 하는 분들이 있는데 이런 분들 블로그 가보면 한결같이 의료 정보, 건강 정보, 세금 정보 등등 천편일률적이고 별 내용도 없는 쓰나마나한 글이 가득합니다. 아마 블로그 강의 비싼 돈 주고 듣고 그런 글들이 돈 된다고 하니 쓰는 것 같은데요. 

 

생각해 보시면 그게 경쟁력이 있겠냐는 겁니다. 그런 흔한 정보 글을 너도나도 쓰면 경쟁이 심한데 검색 상단 노출 확률은 줄어들 수 밖에 없습니다. 이런 챗GPT나 뤼튼 같은 AI 글쓰기가 늘어나면서 저질 블로그 콘텐츠가 확 늘었습니다. 이걸 네이버나 구글이 모를 리가 없습니다. 그런 AI가 쓴 글들은 검색 상위 노출에서 배제하고 있습니다. 구글은 최근 AI를 이용해도 글의 퀄리티가 좋으면 상위 노출이 된다고 하지만 그 말을 믿어서는 안 됩니다. 구글이 만든 제미나이(구 바드)를 활용 빈도를 늘리기 위한 소리입니다. 

 

동영상 제작자들의 비명을 지르게 만든 오픈 AI의 소라(Sora) 동영상 제작 도구

오픈AI의 소라 동영상 제작 기술

그제 소개된 오픈 AI의 소라(Sora)는 동영상 생성형 AI입니다. 지금까지 텍스트 생성형 AI인 챗GPT와 이미지생성형 AI인 달리나 미드저니, 스테이블 디퓨전 같은 서비스가 있었습니다. 글과 사진을 자동 생성하는 AI가 나왔다는 건 동영상도 가능하다는 소리입니다. 

 

이에 구글은 루미에르(Lumiere)라는 동영상 생성형 AI를 공개했습니다. 간단한 동영상을 만들어주는데 너무 티가 나서 그런가보다 했는데 오픈 AI의 소라는 차원이 다릅니다. 위 이미지는 소라가 만든 영상입니다. 

 

Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

 

라는 텍스트를 입력하니 위와 같은 결과가 나왔습니다. Sora라는 단어가 일본어로 하늘이라는 뜻이라고 하네요. 샘플 영상들을 보면 일본 관련 영상이 꽤 많네요. 

 

https://openai.com/sora

 

Sora: Creating video from text

The current model has weaknesses. It may struggle with accurately simulating the physics of a complex scene, and may not understand specific instances of cause and effect. For example, a person might take a bite out of a cookie, but afterward, the cookie m

openai.com

위 링크에 들어가면 샘플 영상이 20개 정도 올라왔는데 모두 감상해 볼 수 있습니다. 어때요? 퀄리티가 엄청납니다. 이전까지는 AI가 만든 동영상이 조잡하다는 느낌이 들었지만 이번 오픈 AI의 소라는 동영상 제작 클립으로 바로 사용해도 될 정도입니다. 특히 쇼츠 배경 영상으로 사용하면 딱 좋겠네요. 그래서 동영상 클립 촬영하고 수익을 얻는 게티 이미지나 셔터 스톡 같은 스톡 사이트에 영상 올려서 돈을 버는 동영상 제작자들에게는 큰 충격을 주고 있습니다. 

 

인간만이 할 수 있다는 창작의 세계에 점점 인공지능이 침투하고 있네요. 물론 자세히 보면 이상한 점들이 꽤 보입니다. 

오픈AI의 소라 동영상 제작 기술

예를 들어서 위 영상을 보면 두 강아지 사이로 들어오는 눈덩이가 보입니다. 이는 물리적으로 자연스러운 현상이 아닙니다. 이런 것을 오픈 AI는 솔직하게 공개했습니다. 아직까지 미흡하고 이상한 재현이 있다는 걸 인정하고 있네요. 보통 이런 새로운 기술 소개할 때 안 좋은 점은 숨기는데 오픈 AI는 자신감이 있는지 자신들의 장점과 한계점을 모두 공개했습니다. 이게 바로 자신감이죠. 

최대 1분짜리 영상을 제작할 수 있는 오픈 AI의 소라

오픈AI의 소라 동영상 제작 기술

사진과 달리 동영상은 촬영 시간도 오래 걸리고 제작하는데 큰 돈이 들어갑니다. 제대로 찍으려면 모델도 고용해야 하고 의상도 갖춰야 하고 고가의 촬영 장비도 갖추어야 합니다. 그 현장에서 촬영해야 하면 이동 비용도 들죠. 

 

그런데 텍스트 몇 줄로 이런 영상을 만든다는 건 근 미래에는 영화 제작도 텍스트로 만드는 시대가 될 수 있고 영화 제작의 민주화가 올 수도 있겠네요. 오픈 AI의 소라는 텍스트를 입력하면 최대 1분짜리 영상을 만들 수 있습니다. 다만 이걸 지금은 아무나 만들 수 있는 건 아니고 선택된 소수의 영상 전문 제작자들 에게만 테스트를 하고 있습니다. 앞으로도 이 소라는 일반인들이 만지기 쉽지는 않을 것으로 보입니다. 왜냐하면 영상 하나 만드는 데는 기존의 텍스트나 이미지와 달리 엄청난 컴퓨팅 자원을 요구하니까요. 게다가 딥페이크 가짜 영상 만드는 악용도 많기에 쉽지 않을 겁니다. 

 

이야기를 들어보니 기존 AI 동영상 제작 기술과 달리 챗GPT에서 사용하고 있는 트랜스포머 알고리즘과 작게 잘라 놓은 클립을 보고 AI가 학습한 후 인지력을 늘려서 영상의 스타일을 유지하는 능력이 꽤 좋아졌다고 하네요. 

 

가장 큰 타격을 받을 업체는 브릿지 영상, 유튜브 배경 영상을 제공하는 스톡 사이트들

오픈AI의 소라 동영상 제작 기술

스톡 사진, 스톡 동영상을 거래하는 셔터스톡이나 게티 이미지는 상업용으로 사용 가능한 유료 사진과 유료 동영상을 유통 판매하고 있습니다. 전 세계에서 사진 및 동영상 제작자들이 영상 브리지 용 영상을 엄청 찍고 있죠. 예를 들어서 서울 도심의 야경을 촬영한 영상이나 타임랩스 영상들이 대표적입니다. 

 

당장 이런 타임랩스 영상을 오픈 AI의 소라가 만들 수는 없습니다. 그러나 위 영상처럼 고퀄리티는 필요 없고 어떤 상황을 묘사하는 단순한 배경 영상 시장은 오픈 AI의 소라가 집어 삼길 수 있습니다. 위 영상을 직접 보시면 드론으로 촬영한 영상처럼 느껴질 정도입니다. 

오픈AI의 소라 동영상 제작 기술

위 영상은 19세기 미국 서부의 골드 러시 당시 마을 풍경입니다. 이런 영상도 텍스트로 만들 수 있습니다. 
물론 이런 영상들은 AI가 만든 영상이라는 워터마크를 강제로 부착해서 오해없게 해야 하겠죠. 

 

창작 영역에 AI가 침투하면서 여러 직업에서 현재까지는 안 좋은 영향을 주고 있네요. 이로 인해 사라지는 일자리가 엄청 늘어나고 있네요. 실제로 기술 선도 기업들이 AI를 만들고 그로 인해 반복 작업하는 직원들부터 해고되고 있네요. 영상 제작 생태계도 10년 안에 엄청난 변화가 나오겠네요. 

 

앞으로 텍스트로 영상을 제작하고 만드는 시대가 되고 있는데 이로 인해 아이러니하게도 기발한 창작력을 가진 사람이 큰 성공을 할 수 있겠네요. AI가 창작한다고 해도 그건 반복 학습의 결과라서 빈틈이 많은데 그 빈틈을 노리는 창작을 하는 인간이 각광받을 듯합니다. 

반응형