본문 바로가기

정보

20분만 목소리를 들려주면 알아서 말하는 프로그램을 개발한 어도비사


어도비(Adobe)라는 


회사에 대해서는 다들 한 번 쯤 들어본 적이 있을 것이다.


PDF라는 파일 형식를 처음으로 개발한 회사가 바로 어도비.


포토샵, 아크로뱃 리더, 라이트룸 등,


막강한 소프트웨어도 여럿 개발했다고 알 수 있다.


어도비 사가 최근에 열렸던 Adobe MAX 컨퍼런스에서 아주 혁신적이고 재미있는 기술 하나를 공개했는데, 


"Project VoCo"라는 기술인데, 


프린스턴 대학 연구팀이랑 


같이 개발한 음성변환(voice conversion) 기술이라고 한다.


간단히 말하자면, 소프트웨어에 


내 목소리를 20분 동안 입력하기만 하면 


컴퓨터가 내 목소리를 알아서 분석해서 


완벽히 내 목소리를 재구현해 내는 것이다. 


이게 무슨 말인지 감이 안 온다면 아래 영상을 보자.


얼마나 대단한지 한번 볼까?





정말 굉장하지? 약간의 부자연스러움이 있긴 하지만, 


목소리의 높낮이, 톤, 발음 습관까지 


거의 완벽히 구현해 낸 걸 볼 수 있다.


이런 기술을 음성 변환 (voice conversion)이라고 하는데, 


이미 90년대 초부터 활발히 연구되고 있었다.


그 때만 해도 텍스트를 합성음으로 


읽어주는 문자-음성 변환(text-to-speech, TTS)이 전부였는데, 


기술의 발전이 참 빠른 것을 볼 수 있다.


atsip-avsp17-45-638.jpg

vcdemo.jpg 

음성 변환 기술의 모식도라고 한다.


이대로라면 목소리도 상품화해서 판매 할 수 있는 


세상이 오지 않을까?






딱 10년 전 영화인 미션 임파서블 3에서


음성 변환 기술이 나오는 장면이 있는데, 


이게 진짜 현실이 되다니, 참 기술의 진보는 무서운 것 같다.