
특징 추출·피부 합성·감정표현 기술
영상·음성 결합 딥러닝 훈련 거쳐
실제 사람과 닮은 동영상으로 제작
만나기 어려운 스타들과 대화 가능
온라인 커머스 홍보에도 활용 기대
국내 최초로 사람의 목소리와 얼굴을 똑같이 합성해 제작한 인공지능(AI) 뉴스 앵커가 등장했다.
23일 딥러닝 기술과 인공지능 서비스를 제공하는 스타트업 머니브레인에 따르면 뉴스 앵커의 영상을 AI 기술로 학습해 실제 뉴스 앵커와 똑같은 말투, 억양 등의 목소리뿐만 아니라 영상으로 말하는 얼굴, 표정 및 움직임까지 합성, 국내 최초 AI 얼굴 영상 합성에 성공했다.
이번에 공개한 인공지능 뉴스 앵커에는 얼굴 특징 추출과 피부합성, 감정표현 등 첨단 인공지능 기술이 적용됐으며 영상과 음성을 결합해 딥러닝 훈련 과정을 거쳐 실제 사람을 닮은 인공지능 영상으로 제작됐다. 이 AI 영상 합성 기술은 중국, 미국과 함께 전 세계에서 3곳에서만 성공한 기술적 난이도가 높은 딥러닝 기술이다. 특히 머니브레인의 기술은 중국에 비해 자연스러운 얼굴 움직임을 구현했고 미국팀의 오바마 합성과 다르게 별도의 영상 보정 없이 순수 딥러닝 기술만으로 구현한 세계 최초의 기술이다.
머니브레인은 앞으로 몇 시간만 AI가 동영상을 학습하면 직접 카메라 앞에서 사람이 촬영하지 않아도 AI가 영상을 자동으로 만들어내는 세상이 올 것으로 기대했다. 또 이 기술을 활용한 서비스로 AI 뉴스 아나운서, AI 한류스타, AI 영어회화 등 사람의 얼굴로 대화하는 모든 분야에 쓰일 수 있고 AI와 얼굴을 보면서 이야기하는 영화 속 상상이 현실로 이뤄 질 것으로 예상된다고 했다.
머니브레인은 스케줄이 바쁜 유명 연예인을 대신해 인공지능 기술이 팬들과 실시간으로 소통하게 될 것이라고 덧붙였다. 이렇게 되면 팬들 입장에서는 실제 마주치기 힘든 스타와의 대화가 가능해지고 지구 반대편의 누구나 글로벌 스타 BTS와 친구가 될 수 있는 시대가 올 것으로 기대된다.
이 AI 영상 합성 기술은 온라인 커머스에도 활용될 수 있다. 최근 온라인 쇼핑몰에서는 매출 촉진을 위해 상품 소개 영상을 대량 제작하고 있지만 수천만개에 이르는 상품을 모두 영상으로 제작하는 것은 현실적으로 불가능하다. 하지만 AI 영상 합성 기술을 사용하면 간단한 제품 소개 내용과 이미지 입력으로 유명 연예인이 상품을 홍보하는 영상을 손쉽게 만들 수 있기 때문이다.
장세영 머니브레인 대표는 “얼굴 영상합성 기술은 세계 수준에 근접한 한국의 몇 안 되는 AI 기술이며 중국과 미국의 AI 기술 회사와 경쟁하고 있는 젊은 AI 스타트업들에 더 많은 투자가 이뤄졌으면 좋겠다”며 “국내에서도 AI 분야에서 세계에 내놓을 수 있는 인공지능 기술들이 개발되고 있는 만큼 이를 뒷받침하기 위한 인력, 정책, 투자 등 많은 관심과 국가적인 지원이 필요한 시점”이라고 밝혔다.
백진용기자 bjy@kwnews.co.kr