실제 성우처럼 분노, 기쁨, 슬픔 등 다양한 감정을 소리의 억양으로 표현할 수 있는 인공지능(AI) 성우가 등장했다.

AI 분야의 신생(스타트업) 기업 휴멜로는 18일 감정 표현이 가능한 AI 성우 서비스 ‘프로소디’(사진)를 선보였다. 프로소디는 기존에 글자를 음성으로 읽어주는 TTS(Text to Speech) 서비스의 경우 억양 없는 어색한 소리 때문에 이용을 꺼리는 문제를 해결하기 위해 개발됐다.

업체에 따르면 프로소디는 사람처럼 다양한 억양으로 감정 표현을 할 수 있다. 또 목소리를 자유롭게 선택할 수 있다. 유명인이 목소리를 제공하면 이를 이용해 우리말, 영어 등으로 AI 음성을 만들어 낼 수 있다.

또 음성 녹음 시간도 대폭 줄일 수 있다. 업체는 기존 음성합성 기술은 최소 3시간 이상 녹음이 필요했지만 프로소디는 녹음 시간이 30분으로 단축된다. 따라서 일정이 바쁜 유명인들도 짧은 시간에 오디오북 녹음이나 더빙 등이 가능하다.

이 업체는 프로소디를 게임, 오디오북, 캐릭터 음성 등 다양한 분야에 활용할 수 있을 것으로 보고 있다. SM엔터테인먼트는 래퍼 슬리피와 함께 프로소디를 이용해 ‘엠 아이 포 리어’라는 노래의 랩을 하기도 했다.

이 업체는 프로소디 활성화를 위해 다음달 22일까지 프로소디를 이용한 콘텐츠 제작 공모전을 개최한다. 프로소디를 이용해 콘텐츠를 만들어 선정되면 소정의 상금을 받을 수 있다. 이자룡 휴멜로 대표는 “지금까지 사람의 음성을 AI로 구현하려고 노력했지만 감정연기에 실패해 활용 범위가 좁았다”며 “감정을 담은 실제 목소리를 구현해 음성계의 포토샵을 지향하겠다”고 밝혔다.

최연진 IT전문기자 wolfpack@hankookilbo.com

공감은 비로그인 상태에서도 가능합니다

web_cdn 저작권자 © 한국일보 무단전재 및 재배포 금지

경제 최신기사