[신문협회] 신문기사 음성 서비스에 인공지능 주목, WP ‘아마존 폴리’ 실험관심
요약
- 워싱턴포스트는 다음 달부터 ‘아마존 폴리’ (텍스트를 실제와 같은 음성으로 변환시키는 음성 변환 서비스)를 이용하여 정치 분야를 제외한 비즈니스, 라이프스타일, 테크놀로지, 엔터테인먼트 분야의 신문 기사를 모바일 이용자들에게 음성으로 지원할 예정임. 이를 위해 현재 테스트 중임.
- ‘아마존 폴리’는 기사 텍스트를 음성으로 자동 변환(단일 기계음)해준다는 점에서 기존 신문기사 음성 서비스와 유사하지만, AI(인공지능) 서비스를 접목시켜 실제 인간이 말하는 것 같은 음향(남성과 여성 47개 음색을 갖추고 24개 언어 지원)을 생성해 낸다는 점에서 차별화됨.
- 신문 기사의 음성 서비스가 이미 존재함에도 불구하고, 워싱턴포스트가 최근 음성 변환 서비스에 주목하는 이유는 다음과 같음.
- 1) 최근 미국 내 인터넷 라디오 청취율과 팟케스트 청취율이 상당히 늘고 있으며,
- 2) 음성 변환 서비스는 시각 장애를 가진 이용자들에게 유용한 도구가 될 수 있기 때문임.
개요
아마존의 AI(인공지능) 기술 ‘폴리(Polly)’는 텍스트를 실제와 같은 음성으로 변환시키는 음성 변환(text-to-speech) 서비스임. 워싱턴포스트는 다음 달부터 아마존 폴리를 이용하여 정치 분야를 제외한 비즈니스, 라이프스타일, 테크놀로지, 엔터테인먼트 분야의 신문 기사를 모바일 이용자들에게 음성으로 지원할 예정임. 자세한 내용을 소개하고자 함.
워싱턴포스트 앱에서 테스트 중
테스트 결과, 음성 기사를 선택하여 플레이한 독자 중 25% 이상은 전체 내용을 전부 들었다고 함. 워싱턴포스트는 이에 대해 기사 한 편이 약 5~6분 정도 걸린다는 것과 이 실험을 발표한 지 1주일 밖에 되지 않았다는 것을 고려하면 나쁘지 않은 수치라고 판단함.
워싱턴포스트가 음성 변환 서비스에 주목하는 이유
신문 기사의 음성 서비스는 새로운 것이 아님. ‘포켓(Pocket)’은 나중에 읽고 싶은 기사를 저장해 두는 스마트폰 앱으로, 기기에 내장된 기능을 사용하여 음성 변환 서비스 ‘리슨(Listen)’을 제공함. 구글은 음성인식 소프트웨어 ‘드래곤 내츄럴리스피킹(Dragon NaturallySpeaking)’과 비슷한 안드로이드 앱을 운영 중임. 아이폰 이용자들은 설정을 통해 ‘스피크 스크린(Speak Screen)’ 옵션을 켤 수 있으며, 시리(Siri)를 활용해 웹페이지를 음성으로 들을 수 있음.
신문 기사의 음성 서비스가 이미 존재하지만, ‘아마존 폴리’는 기존 서비스와 차별화됨. 기사 텍스트를 음성으로 자동 변환해준다는 점에서 유사하지만, 기존 음성 서비스가 기계적 음성으로 읽는 반면, ‘아마존 폴리’는 AI(인공지능) 서비스를 접목시켜 실제 인간이 말하는 것 같은 음향을 생성해 낸다는 점에서 차별화됨. 예를 들어, ‘아마존 폴리’는 단어 발음이 문맥에 따라 달라진다는 점을 인식하고, 동형이의어를 구별하여 철자가 같아도 상황에 따라 발음을 다르게 생성함. 또한 남성과 여성 47개 음색을 갖췄고 24개 언어를 지원함.
워싱턴포스트는 음성 변환 서비스에 주목하는 이유를 다음과 같이 밝힘.
퓨리서치센터의 최신 미디어 동향 보고서에 따르면, 미국인들의 인터넷 라디오 청취율이 점점 높아지는 추세이며(특히 차 안에서), 팟캐스트를 듣는 사람의 비율이 몇 년 전부터 상당히 늘고 있다고 함. 이에 따라 워싱턴포스트, 뉴욕타임즈, 내셔널 퍼블릭 라디오(NPR)와 같은 주요 뉴스 기관은 뉴스 쇼 ‘더 데일리(The Daily)’에서부터 경쟁 쇼 ‘업 퍼스트(Up First)’까지 다양한 팟캐스트에 투자하고 있다고 함. 즉, 워싱턴포스트는 음성으로 듣는 기사의 수요가 점점 더 늘어날 것으로 판단함.
또한 음성 변환 서비스는 시각 장애를 가진 이용자들에게 유용한 도구가 될 수 있음.
음성변환서비스에 대한 워싱터포스트의 목표과 향후 계획
워싱턴포스트는 음성 변환 기능을 계속 실험할 것이며, 실제 사람이 말하는 것과 같은 음성 품질로 향상시키는 것이 목표라고 밝힘. 이 서비스 기술은 알렉사(Alexa: AI를 활용한 음성 비서 시스템), 에코(Echo: 음성 인식 AI 스피커)와 같은 다른 아마존 AI 상품과 비슷함. 향후 기능에는 오프라인 오디오 재생, 개인 맞춤 플레이리스트, 포스트의 기본 앱으로 제공 등이 포함될 예정임.
시사점
- 워싱턴포스트는 음성 변환 서비스에 관심을 갖고 점차 확장할 추세임. 이는 음성 인식 기술이 점점 활성화되고, 점차 스크린이 사라질 것이라는 미디어 트렌드를 반영한 행보임.
- 국내 언론사들 역시 변화하는 미디어 지형에 맞춰 음성 변환 기술에 관심을 가져야 할 필요가 있으며, 차별화 활용 전략 등을 검토할 필요가 있음