[신문과 방송] 뉴스, 이제 소리로 본다 : AI 기술이 주목하는 음성 뉴스… 언론사에도 기회
#사례 1) 2018년 PWC의 소비자 보이스 어시스턴스 관련 조사(PWC Consumer Intelligence Series voice Assistants survey)는 음성 비서 서비스를 이용하는 사람들을 대상으로 이들이 매일 쓰는 분야를 조사했다. 중복 응답이 가능한 설문에서 응답자들은 뉴스와 날씨 확인(35%)을 가장 많이 사용한다고 대답했고, 다음으로는 음악 감상(33%), 정보 검색(32%), 이메일 또는 문자 보내기(31%), 짧은 질문하기(29%), 타이머 설정(23%) 순으로 대답했다.
보이스 퍼스트 기기, 음성 비서 서비스, AI 스피커 시장 등 다양한 이름으로 불리는 음성 인식 서비스 분야에서 뉴스는 가장 많이 소비되는 콘텐츠다. 지난 2016년 말 보이스랩(VoiceLabs) 조사에서도 아마존 알렉사 앱스토어에서 가장 많은 서비스는 단연 뉴스 앱이었다.
뉴스 읽어주는 AI, 개인 라디오 플랫폼 인기몰이
#사례 2) “샐리야, 정치 뉴스 들려줘.”
“YTN 정치 뉴스입니다. 지난 3일 문재인 대통령은….”
“샐리야, 문재인 대통령 뉴스 들려줘.”
“요청하신 뉴스는 현재 제공하고 있지 않습니다. 제공 가능한 뉴스 분야는 정치‧경제‧사회‧문화‧스포츠 과학입니다.”
필자가 쓰고 있는 네이버의 ‘웨이브’라는 AI 스피커(보이스 퍼스트 스피커)는 YTN의 주요 뉴스를 네이버의 기술로 읽어준다. 특정 검색어에 대한 뉴스는 아직 제공하지 않지만 머지않은 미래에 서비스가 가능해질 것이다. 이미 모바일 네이버앱에서는 제공하고 있는 기능이기 때문이다. 이외에도 지난 5월 CBS는 아마존의 AI 기술을 바탕으로 실제 인간의 발음과 유사한 기술(text to speech)을 도입해 음성 뉴스 서비스를 자체 홈페이지에서 제공하고 있다.
#사례 3) 지난 2016년 3월 출시된 ‘스푼 라디오’라는 음성 플랫폼은 ‘어른들은 모르는 우리들만의 라디오’라는 콘셉트로 빠르게 성장하고 있는데, 최근 국내외 VC로부터 190억 원의 투자를 유치했다. 현재 2,000여 명의 DJ가 스푼 라디오에서 수익을 내고 있으며, 매일 1만 개 이상의 콘텐츠가 만들어지고 있다. 최상위권 DJ의 경우 매달 수천만 원의 수익을 내는 등 개인 라디오 플랫폼의 가능성을 확인하고 있다.
이에 앞서 ‘팟빵’이라는 팟캐스트는 30대 이상의 많은 유저들에게 이미 라디오를 대체하는 대안 플랫폼으로 자리 잡았다. 최근 팟캐스트 플랫폼 팟빵의 ‘시사 및 정치’ 카테고리를 보면 전문 팟캐스트들도 있지만 TBS, YTN, SBS, CBS, JTBC 등 자체 제작 서비스가 높은 순위에 올라 있는 걸 볼 수 있다.
매우 고무적인 성과지만 팟캐스트 업계 관계자들을 만나보니 전체 순위 10위권은 돼야 월 3,000만 원 정도의 수익이 기대된다고 한다. 당장은 이처럼 큰돈이 되지 않는 게 현실이긴 하다. 하지만 주 청취자가 우리 사회를 실질적으로 이끌어가는 30~40대라 여론에 미치는 영향은 어느 때보다 높다고 할 수 있겠다.
이처럼 급변하는 미디어 환경에서 ‘듣는 뉴스’에 대한 관심이 갈수록 커지고 있다. 이런 현상이 왜 일어나고 있으며, 언론 업계(미디어)는 어떤 준비를 해야 할까?
2016년 출범한 음성 플랫폼 ‘스푼 라디오’. 스푼 라디오에서 활동하며 수익을 내는 DJ가 2,000여 명에 이르는 등 개인 라디오 플랫폼의 가능성을 보여주고 있다.
스마트폰 이후는 AI
IT 벤처 업계에서는 10년 주기로 크게 시장이 변한다는 속설이 있다. 1990년대 중반 인터넷 보급은 수많은 IT 공룡 기업을 탄생시켰고, 2007년 출시된 아이폰은 전 세계를 ‘모바일 퍼스트’ 열풍에 휩싸이게 했다. 아이폰이 세상에 모습을 드러낸 지 10여 년. IT 벤처 업계는 최근 ‘인공지능(AI)’과 ‘블록체인’이라는 거대한 변화에 직면해 있다.
이 중에서도 AI 기술을 활용한 새로운 도전은 IT 산업 전반에 영향을 끼치고 있다. 구글, 페이스북, 아마존, 네이버, 카카오와 같은 거대한 플랫폼 기업들은 사활을 걸고 관련 기술을 발전시켜나가고 있다. 특히 여러 플랫폼 기업들은 AI 스피커, 커넥티드 카 등 스마트폰 이후의 ‘AI 하드웨어’ 시장을 장악하기 위한 경쟁에 들어갔다.
시장조사기관 카날리스(Canalys)에 따르면 지난 2017년 1분기 전 세계 AI 스피커 시장 판매량의 약 80%는 아마존이 차지했으나, 올해 1월 아마존의 점유율은 27.7%에 불과했고, 구글이 36.2%로 1위에 올라섰다. 뒤를 이어 알리바바 11.8%, 샤오미 7% 등 글로벌 IT 공룡들의 각축장이 펼쳐지고 있다. 시장 경쟁이 본격적으로 시작된 것으로 국내에서도 네이버나 카카오, SKT, KT 등 대기업들이 앞다퉈 AI 스피커를 선보이고 있다.
또 이마케터(eMarketer)에 따르면 AI 스피커 사용률은 2016년 5.8%에서 2017년 13%로 급등한 데 이어 2019년에는 18.8%까지 증가할 것으로 예상된다.
이들이 AI 스피커를 선보이는 이유는 간단하다. AI 스피커는 주로 가정의 거실이나 독립된 방에서 사용되는데, 스마트폰을 쓰지 않는 시간에도 사람들의 생활 속에 자사 서비스를 침투시키기 위해서다. 거실이나 자동차와 같은 공간에서 편하게 이러한 서비스를 사용하려면 기존의 키보드나 마우스를 이용해 컴퓨터를 쓰거나, 터치스크린으로 스마트폰에 명령하는 것 이상의 인터페이스가 필요하다. 그중에서도 ‘음성’이 가장 적합한 사용자 환경이라는 게 업계의 중론이다. 그리고 사람의 음성과 대화의 맥락을 이해하려면 뛰어난 인공지능 기술이 필요하다.
이런 가운데 지난 7월 12일 구글과 카카오, 현대‧기아자동차는 서로 협력해 차량용 커넥티드 카 서비스인 ‘안드로이드 오토’를 국내에 선보였다. 역시 스마트폰을 쓰지 못하는 시간대에도 자사 서비스를 공급하기 위해 연합했다고 볼 수 있다. 네이버는 이에 앞서 자사의 첫 번째 하드웨어인 커넥티드 카 서비스 ‘어웨이’를 출시한 바 있다.
네이버 송창현 CTO는 “생활환경지능(ambient intelligence)은 PC와 스마트폰을 벗어나 일상 생활에서 기술이 사람과 상황‧환경을 인지하고 이해해 자연스럽게 사람에게 필요한 정보나 행동을 제공하는 것을 뜻한다. 생활환경지능을 구현하기 위해서는 사물‧감정‧상황‧공간을 인식하는 ‘인식‧이해기술’, 묻기 전에 답과 정보 행위를 예상해 추천하는 ‘예측 기술’, 사람이 기술을 배우지 않아도 자연스럽게 사용이 가능한 ‘자연스러운 사용자 경험’이 뒷받침되어야 한다”고 말했다.
즉 최근 IT 플랫폼 기업들이 스마트폰 이후의 산업 생태계를 장악하기 위한 전쟁을 펼치고 있는 가운데 그 최전선에 AI 기술을 활용한 여러 음성 인식 기기들이 관심을 끌고 있다. 더불어 스푼 라디오나 팟빵처럼 과거의 라디오를 대체하는 새로운 플랫폼이 갈수록 우리 실생활을 파고들고 있다. 이런 ‘보이스 퍼스트’ 서비스에서는 킬러 서비스로 음악과 퀴즈, 간단한 검색과 더불어 언론이 제공하는 음성 뉴스가 주목받고 있는 것이다.
‘보이스 퍼스트’에 대비하라
지난해 8월 BBC는 아마존 알렉사 플랫폼에서 작동하는 자사의 첫 번째 완전한 음성 앱(Full voice app)을 선보이고, 다른 AI 스피커용 앱도 차차 소개할 계획이라고 밝혔다.1 이 앱은 BBC가 운영하는 모든 라디오 서비스, 팟캐스트를 제공한다.
왜 언론사들은 음성 서비스 플랫폼에 자사의 뉴스를 노출해야 할까? 앞서 설명했듯 플랫폼 기업들의 경쟁으로 인해 사용자들의 음성 인터페이스 사용 빈도가 갈수록 높아지고 있기 때문이다.
2016년 구글 I/O 기조연설에서 순다 피차이 CEO는 구글의 모바일 검색 중 20%가 음성 검색이라고 공개한 바 있다. 영국의 경제 매체 캠페인은 컴스코어(comScore)의 자료를 인용해 2020년에는 전체 검색의 50%가 음성으로 이루어질 것으로 전망했다. 다소 과장된 수치일 수는 있지만 앞으로 컴퓨터를 통한 정보 탐색은 텍스트 입력과 더불어 음성 검색이 메인이 될 거라는 시대의 변화를 읽어야 한다. 정보성 콘텐츠를 소비하는 소비자들의 변화를 따라가야 하는 게 공급자로서 당연한 일일 것이다.
특히 점점 챗봇이나 음성 인터페이스로 컴퓨터와 대화하는 게 더 이상 어색하지 않은 시대가 돼가고 있다. 이수만 SM 총괄프로듀서는 “모바일 네이티브 제너레이션의 다음 세대인 AI 네이티브 제너레이션을 굉장히 중요하게 보고 있다”면서 “앞으로 세상을 어떻게 살아갈지 다 함께 고민해야 한다”2고 말했다.
또 안타까운 현실이지만 현재 국내 언론사들은 아무래도 IT 서비스 쪽보다 콘텐츠 제공자(CP) 로서의 역량이 훨씬 뛰어나다는 한계가 있다. 물론 언론사 스스로 플랫폼을 구축하지 말라는 법은 없다. 하지만 전 세계 어떤 언론사도 구글이나 아마존, 네이버나 카카오 등 기존 플랫폼 기업과 경쟁할 수 있는 AI 스피커나 인공지능 기술을 보유하고 있지 않다. 네이버만 하더라도 이제 네 시간 정도만 학습하면 특정인의 목소리를 그대로 재현해낼 수 있는 음성 AI 기술을 보유하고 있다.
또 국내 언론사의 경우 벤처기업인 팟빵이나 스푼 라디오처럼 당장 플랫폼 사업을 할 수 있을 만한 내부 준비도 아직은 미비한 상태다. 이런 상황에서 콘텐츠 제공자로서 가장 매력적인 콘텐츠를 생산해 여러 플랫폼사가 서로 러브콜을 보내는 상황을 만드는 게 차선이라고 생각한다. 콘텐츠를 판매할 수 있는 몸값을 올리는 좋은 시기가 지금이라는 의미다.
특히 가장 중요한 점은 언론사들이 사용자 머릿속에 확실히 각인될 지적재산권(IP)을 만드는 일이다. 우선 가능성이 보이는 플랫폼에서 언론사가 초기에 사용자를 먼저 확보하는 게 매우 중요하다.
실제로 네이버와 KTB는 ‘NAVER-KTB 오디오 콘텐츠 전문투자조합(오디오콘텐츠 펀드)’을 300억 원 규모로 결성했는데, 지난해 12월 처음으로 투자한 회사가 중국 고전 오디오 콘텐츠를 제공하는 ‘고전백독: 논어’ 프로젝트였다. 최근에는 SNS 기반 음악 채널인 ‘딩고 뮤직’, 모바일 특화 뮤직비디오인 ‘세로라이브’를 선보이며 페이스북과 유튜브 등에서 구독자 900만 명을 보유한 ‘메이크어스’도 이 펀드에서 투자를 이끌어냈다.
다른 콘텐츠 제공자들을 연구하자
언론도 변하는 시대에 부응해야 한다. 최근 SNS에 적합한 카드 뉴스를 만드는 등 언론사도 변화를 꾀하고 있지만, 아직 많은 언론사는 신문 지면을 그대로 온라인으로 옮기거나 방송 동영상을 업로드하는 수준에서 인터넷 환경에 대응하고 있다. 일단은 보이스 퍼스트 서비스(AI 스피커나 커넥티드 카, 팟빵, 스푼 라디오)에서 사람들이 어떤 콘텐츠를 소비하는지, 또 어떤 형식이 적합한지 연구해야 한다.
예를 들어 사용자들이 날씨 정보를 많이 물어 보는데, 다른 콘텐츠 제작자 대비 언론사가 더 멋진 날씨 정보를 전달하려면 어떻게 해야 할까? 미국에서는 아마존 알렉사에서 퀴즈 게임을 많이 한다던데 게임형 뉴스를 만들어볼 수는 없을까? 이처럼 시대에 맞는 고민을 하고 여러 실험이 필요하다. 음성 콘텐츠를 어떻게 하면 효율적으로 제작하고, 시대에 맞는 스타 저널리스트를 어떻게 키워낼 것인지 지금 당장 고민하고 실천에 옮겨야 할 때다.
출처 : http://blog.naver.com/PostView.nhn?blogId=kpfjra_&logNo=221335720181&redirect=Dlog