[AI 타임스] NYT 등 10개사 “오픈AI의 웹 검색도 불허”…’서치GPT’ 차단 조치
뉴욕타임스(NYT) 등 10여개 뉴스 사이트가 오픈AI 검색엔진 ‘서치GPT(SearchGPT)’의 접근을 금지했다. 인공지능(AI) 학습을 위한 데이터 수집뿐만 아니라, 검색까지 허용하지 않겠다는 일이다.
비즈니스 인사이더는 3일(현지시간) 뉴욕타임스와 최소 13개의 다른 뉴스 사이트가 오픈AI의 ‘OAI-서치봇(OAI-SearchBot)’을 차단했다고 보도했다.
이는 오픈AI가 서치GPT 사용자에게 관련 결과를 검색하여 보여줄 수 있도록 정보를 색인화하는 웹크롤러다. AI 학습 데이터를 모으기 위한 웹 크롤러 ‘GPT봇(GPTBot)’과는 다르다
웹 검사도구 오리지널리티닷에이아이(Originality.AI)에 따르면 NYT 외에도 와이어드, 더 뉴요커, 보그, 베니티 페어, GQ 등 14개 뉴스 사이트가 OAI-서치봇을 차단한 것으로 나타났다.
다만 존 길럼 오리지널리티닷에이아이 CEO는 “약간 의아한 일”이라며 “퍼블리셔들이 왜 그것을 차단하려고 하는지 이해할 수 없다. 이것은 퍼블리셔들이 원하고 필요로 하는 트래픽”이라고 밝혔다. 이어 “주요 뉴스 출판사 중 구글의 검색 봇을 차단하는 퍼블리셔는 없다”고 덧붙였다.
오픈AI는 지난주 AI 기반 검색엔진인 서치GPT를 선보였다. 사용자 질문에 대해 뉴스코프나 애틀랜틱 매거진 같은 파트너사들 뉴스를 포함해 다양한 출처 정보들을 인용, 요약한 정보를 제공한다.
우선 소규모 테스트 그룹과 퍼블리셔들을 대상으로 테스트를 진행한다고 밝혔다. 특히 OAI-서치봇은 AI 모델을 훈련하기 위한 데이터를 수집하기 위해 웹을 크롤링하지 않는다고 강조했다. 그러면서 웹사이트 소유자들에게 검색 결과에 나타나도록 하기 위해 새로운 봇을 허용하라고 조언했다.
모든 웹사이트에 대해 접근할 수 없다면, 오픈AI의 서치GPT 서비스는 구글 검색엔진보다 정확도가 떨어질 수 있다.
한편, 오픈AI는 수년간 허가 없이 온라인 데이터를 수집해 왔다. 이 때문에 퍼블리셔들은 새로운 검색 봇이 콘텐츠를 몰래 수집하지 않을 것이라는 점을 쉽게 믿지 못하는 모습이다.
또 검색 결과가 원본 콘텐츠를 만든 웹사이트 트래픽으로 항상 이어지지 않는다는 설명이다. 특히 AI 기반 검색엔진은 요약을 보여줌으로써 사용자를 붙잡아 두는 것을 목표로 한다. 퍼블리셔들이 검색엔진으로부터 큰 트래픽을 얻지 못한다면, 봇을 허용해야 할 이유가 없다는 논리다.
특히 NYT는 오픈AI와 저작권 소송을 진행 중이다. 올 초 제출한 소송장에는 검색엔진이 점점 더 AI 기반이 되며, 퍼블리셔로부터 트래픽을 빼앗을 가능성이 있다는 점도 지적했다.
출처 :
https://www.aitimes.com/news/articleView.html?idxno=162203