Tagged: 학습 데이터

[중앙일보] 내 속 긁지마, AI에 선전포고…네이버 ‘크롤링 전쟁’ 뭐길래

  AI 시대, 불붙는 ‘크롤링 전쟁’ 이 정도면 ‘메이드 인 판교 인공지능(AI)’보다 낫다고? 요즘 실리콘밸리산(産) 빅테크 AI, 한국 사정과 한국어에 빠삭하다. 소버린 AI(각국 독자적 AI)로 불리는 국산 AI가 아쉽지 않을 정도. 쇼핑, 블로그, 부동산,...

[디지털투데이] 법적 리스크보단 AI 학습 데이터가 먼저?…대담해진 테크 기업들

   [사진: 셔터스톡] [디지털투데이 황치규 기자] 거대언어모델(LLM) 기반 생성형 AI를 개발하는 회사들이 모델 훈련에 쓸 괜찮은 데이터 구하기가 어려워지면서 점점 과감한  행보를 보이고 있다. 가져다 쓸만한 데이터는 고갈되고, AI 훈련에 필요란 데이터를 AI로 만드는 합성 데이터만으로는 갈증을 채울...

[미디어오늘] 네이버AI에 후쿠시마 오염수 논란 묻자 ‘나무위키’ 링크 떴다

뉴스·정보 측면에서 살펴본 클로바X 나무위키·블로그 링크 제시, 언론 ‘불펌’ 블로그 제시하기도 “피드백 반영해 고도화하고 참고링크 범위 확대 예정” ▲ 클로바X 서비스 갈무리 네이버판 챗GPT 클로바X가 지난 8월24일 베타 버전을 출시했다. 네이버는 ‘뛰어난 한국어 능력’과...

[ITWORLD] “공유지의 비극은 어디서든 가능하다” 챗GPT와 LLM의 어두운 미래

기술 세계에서는 모두가 결국 기생 생물이다. 드루팔을 만든 드리스 보이타르트가 몇 년 전에 말했듯이 사람은 모두 만드는 사람(maker)보다는 취하는 사람(taker)에 가깝다. 보이타르트는 오픈소스 커뮤니티의 일반적인 관행을 두고 “취하는 사람은 자신이 이익을 취한 오픈소스 프로젝트에...