[블로터] 하이브 AI 신기술 ‘위버스콘’서 직접 들어보니…남은 과제는 ‘익숙함’
“저 여자 목소리, 정말 라이브로 부르는 거예요?”
이는 ‘레이븐(Raven)’을 접한 이후 기자가 하이브 관계자에게 가장 많이 한 질문이다. 레이븐은 엔터 플랫폼 기업 ‘하이브’ 산하 법인 ‘하이브 아이엠(IM)’이 아티스트 ‘미드낫(MIDNATT·가수 이현)’을 통해 공개한 음성 디자인 기술을 말한다.
‘대중에 첫 선’ AI 음성 디자인 기술 ‘레이븐’
레이븐은 인공지능 오디오 기업 수퍼톤이 하이브IM과 협업해 개발한 실시간 음성 디자인 기술이다. 가수의 목소리를 제작자나 크리에이터가 새로 디자인한 보이스나 ‘특정’ 보이스로 바꿀 수 있다.

(사진=위버스콘 페스티벌)
미드낫의 곡 마스커레이드 속 여성 가수 파트는 여성 가수가 아닌 남성인 미드낫(이현)의 목소리인 것이다. 이는 미드낫이 직접 부른 노래에 레이븐을 적용해 여성의 목소리로 변환한 결과다. 하이브는 레이븐에 대해 아티스트나 해당 곡에 어울리는(최적화된) 목소리로 제작하는 기술로 소개하고 있다.
간담회 당시 미드낫은 “위버스콘 페스티벌에서 라이브로 마스커레이드 공연을 선보일 것”이라고 전했다. 위버스콘에서 미드낫의 목소리가 실시간으로 여성의 목소리로 변환되는 것을 선보이겠다는 의미였다. 레이븐은 이미 녹음된 음원 뿐만 아니라 라이브 공연 중 실시간으로 적용할 수 있도록 완성도를 높였다.
그로부터 약 한 달이 지난 지난 11일, 기자는 예상치 못한 때에 레이븐을 직접 확인하게 됐다. 이날 저녁 서울 올림픽공원 KSPO DOME에서 열린 ‘위버스콘’에서 진행된 엄정화 헌정 공연 ‘트리뷰트 스테이지’ 2회차 공연 첫 곡 차례에서다.
트리뷰트 스테이지 첫 곡으로 엄정화의 1996년 곡 ‘하늘만 허락한 사랑’의 전주가 흘러나왔는데, 무대에는 엄정화가 아닌 미드낫(이현)이 등장했다. 기자는 이것이 지난달 미드낫이 예고했던 ‘보이스 디자이닝을 선보일 공연’임을 뒤늦게 깨달았다.
이현은 본래 목소리와 엄정화의 목소리로 해당 곡을 소화했다. 노래가 끝나고 그는 “저의 목소리를 실시간으로 엄정화 선배님의 목소리로 교체 가능한 보이스 디자인 기술 ‘레이블’을 접목시켰다”며 청중에게 신기술을 소개했다.
솔직하게 말하자면 기자는 당시 들었던 여성의 목소리(이현이 부른)가 이상하게 들렸다. ‘마스커레이드’ 음원을 들었을 때와 달리 실시간으로 변환된 엄정화의 목소리에서 이질감이 크게 느껴졌다. 당시에는 그 목소리가 엄정화같지 않았던 것은 물론, 기계음까지 많이 섞인 것처럼 들렸다. 현장에서 처음 보이스 디자이닝 기술을 확인한 관객들의 반응도 신기함과 당황스러움이 공존하는 듯 했다.
상용화는 이미 시작됐다
집으로 돌아가는 길 기자는 하이브 관계자에게 “정말 라이브로 부른 것이 맞냐”고 또 다시 물었다. 하이브 관계자는 “미드낫은 당시 실시간으로 라이브 공연을 선보인 게 맞다”고 답했다. 아마 현장에서 직접 확인한 것은 처음이라 낯설 수 있다는 것이었다.

아티스트 미드낫(가운데). (사진=하이브)
반전은 이날 찍어둔 영상을 확인했을 때 일어났다. 재생을 누르고 스마트폰을 귀에 가져다댔을 때 들린 목소리는 분명 엄정화였기 때문이다. 아마도 ‘외형은 미드낫, 목소리는 엄정화’인 상황에 적응하지 못한 탓에, 현장에서 레이븐으로 실시간 변환한 ‘미드낫+엄정화’의 목소리를 객관적으로 듣지 못했던 것 같다는 결론을 내렸다.
피부로 느낀 하이브IM과 수퍼톤의 기술 레이븐은 훌륭하면서도 부족했다. 기술적으로는 완성도가 높다해도 라이브 현장을 마주했을 때 낯설게 느껴진 탓이다.
그럼에도 레이븐은 향후 많은 기술적 도전을 지속할 예정이다. 레이븐이 앞으로 대중 앞에 나설 일이 많을 것으로 보인다. 첫 타자인 미드낫 뿐만 아니라 하이브 산하 아티스트 등이 사용할 것으로 예상되며, 여기에 위버스콘처럼 앞으로 라이브 공연에서 선보일 수 있다. 미드낫 역시 지난달 기자간담회 당시 레이블에 대해 ‘경이롭다’며 향후 다양한 시도가 가능해질 것이라고 소감을 전한 바 있다.
이제 막 대중 앞에 나선 레이븐이 풀어야 할 과제는 기술적 완성도 뿐만 아니라 대중이 자연스럽게 느끼도록 하는 적응 과정이다. 하이브 관계자는 “음성 디자인 기술 레이븐은 화자 표현에 필수적인 다양한 변수 및 패러미터들을 실시간으로 보정할 수 있다”며 “향후 라이브 공연 등에 유용하게 사용될 예정”이라고 말했다.

(사진=하이브 홈페이지 화면 갈무리)
출처 :
https://www.bloter.net/news/articleView.html?idxno=602657