AI로 쇼호스트 음성 수정한다…SK스토아 ‘음성합성 기술’ 선보여

14

데이터 홈쇼핑 기업 SK스토아는 방송에 인공지능(AI) 음성합성 기술을 도입한다고 20일 밝혔다.

이는 쇼호스트의 음성이나 대사를 수정할 때 AI로 클로닝(특정 목소리를 복제하는 기술) 등의 정교한 작업을 진행해 자연스러운 음성을 구현하는 기술이다.

▲SK스토아 제공
▲SK스토아 제공

지금까지는 일정 부분을 다시 녹화하거나 쇼호스트가 직접 후시 녹음(촬영이 끝난 후 화면에 맞춰 대사 등을 녹음하는 것)을 해야 했다. 

하지만 AI 음성합성 기술을 적용하면 재녹화 없이 빠르고 자연스러운 멘트 수정이 가능해져 제작 효율성을 크게 높일 수 있다. 

SK스토아는 해당 기술을 도입하기 위해 지난해부터 쇼호스트의 음성 테스트를 진행해왔다. 작년 하반기부터는 네오사피엔스의 타입캐스트(typecast) 서비스를 활용해 일부 패션 방송 프로그램의 가격 및 색상 멘트 수정, 프로모션 내용 변경 등에 AI 음성합성 기술을 적용했다.

올해는 쇼호스트 음색, 어조에 따른 다양한 클로닝 모델을 학습시키고 발음에 따른 정교한 타이밍 교정 등 기술을 고도화하여 AI 음성합성 기술 활용 분야를 점진적으로 확대해나갈 계획이다. 

현재 SK스토아는 성우 음성과 배경음악에도 AI를 활용하고 있다. 이를 통해 기존 방식 대비 90% 이상 비용 절감 효과를 거두고 있다. 배경음악 역시 AI음원 제작을 활용 중이다. 

김형준 SK스토아 방송운영본부장은 “사내에서는 AI 복면가왕(AI 작사작곡 콘테스트) 등 다양한 프로그램을 마련해 AI에 대한 접점을 높이며 일하는 방식을 개선하고 있다“며 ”앞으로도 SK스토아가 독보적인 AI커머스 채널로 거듭날 수 있도록 끊임없이 노력하겠다”고 밝혔다.

+1
0
+1
0
+1
0
+1
0
+1
0