Tagged: AI 모델

[디지털데일리] “엔비디아 없어도 된다”…中 지푸, 화웨이 칩으로 만든 AI 모델 첫선

[디지털데일리 김문기 기자] 중국의 대표적인 인공지능(AI) 스타트업 지푸(Zhipu, Knowledge Atlas Technology)가 화웨이(Huawei)의 반도체만을 사용해 훈련한 새로운 AI 모델을 공개하며 기술 자립의 이정표를 세웠다. 14일(현지시간) 블룸버그통신 등 외신에 따르면 지푸는 자사의 오픈소스 이미지 생성 모델인...

[AI타임스] 앤트로픽, LLM 내부 작동 방식 일부 파악…”사람처럼 실제 추론·추상화 실행”

앤트로픽이 그동안 ‘블랙박스’로 알려졌던 대형언어모델(LLM)의 내부 작동 방식을 분석하는 기술을 개발했다. 이를 통해 ‘클로드’의 작업 수행 과정을 지켜본 결과, 이제까지 알려지지 않았던 몇가지 특징을 찾아냈다고 전했다. 앤트로픽은 27일(현지시간) 인공지능(AI)이 작업을 수행할 때 활성화되는 경로를...

[AI타임스] “AI 에이전트 ‘마누스’, 기대 못 미쳐…클로드·큐원 등을 활용”

‘제2의 딥시크’로 주목받는 마누스 AI가 시장의 기대와 의구심을 동시에 불러일으키고 있다. 중국에서는 뜨거운 관심을 받고 있지만, 해외에서는 기대에 못 미친다는 평가가 속속 등장하고 있다. 테크크런치는 9일(현지시간) 마누스가 소셜 미디어에서 폭발적인 반응을 얻고 있지만, 실제...

[디지털투데이] 이커머스판 ‘AI 전쟁’ 불붙는다…네이버 참전에 데이터 확보 사활

네이버, 물류 등 총망라 AI 기반 이커머스 본격화 예고 쿠팡, 전 과정 실시간 ML 빠른배송 핵심…컬리 ‘검색 의도’ 반영 상품추천 에이블리·무신사 등 패션 버티컬, AI 큐레이션이 플랫폼 핵심   이커머스 업계가 AI 서비스를 강화하고...

[조선일보] 일반 GPU로 AI 학습속도 104배 높였다

한동수 KAIST 교수 연구진       한국과학기술원(KAIST) 연구진이 고가의 인공지능(AI)용 그래픽처리장치(GPU) 없이도 거대 모델을 만들 수 있는 기술을 개발했다. 중앙처리장치(CPU)와 GPU를 병렬로 사용하고 네트워크 속도에 따라 데이터를 압축, 전송해 효율을 높이는 방식이다./로이터 연합뉴스...

[디지털투데이] 소형 언어 모델, 생성형 AI판 격전지로…”작지만 성능은 GPT 3.5급”

마이크로소프트가 신형 소형 AI 모델 파이3(Phi-3) 3종을 선보인다. 마이크로소프트는 파이3 시리즈 중 가장 소규모 모델도 오픈AI GPT-3.5 수준 역량을 보여준다고  강조해 눈길을 끈다. 마이크로소프트는 파이-3 시리즈 중 가장 소형 버전인 파이-3 미니를 먼저 선보인다. 파이-3 미니는...

[문화일보] “언어모델 ‘올모’ 맘껏 베껴라” AI2, 공익·비영리 LLM 선도

MS공동 창업자 故 폴 앨런 설립 사전학습 데이터 ‘돌마’도 공개 “맘껏 베껴라.” 앨런 인공지능연구소(AI2)의 과감한 개방성은 엔드투엔드(End-to-End) 개방형 언어모델 ‘올모’의 사전 학습용 데이터부터 인공지능(AI) 모델 테스트 데이터까지 남김없이 공개하는 자신감에서 엿보인다. 홈페이지에서 올모의 목표를...

[지디넷코리아] [데뷰23] AI 모델 효과적으로 개선하려면

“무관한 데이터 차단·리트리버로 정보 수집·인간 뇌 학습 모방 필요” “인공지능(AI) 모델은 완벽하지 않습니다. AI는 판단을 못 하거나, 무관한 데이터를 습득하기도 합니다. 또 꾸준히 가르쳐야 합니다. AI 모델을 효과적으로 개선하려면 해당 이슈를 잘 해결해야 합니다.”...

[지디넷코리아] 스택오버플로우, 챗GPT 활용 답변달기 금지

스택오버플로우가 오픈AI의 대화형 챗봇을 이용한 답변 등록을 금지했다. 사용자의 질문에 AI로 생성한 답변을 올리면 잘못된 정보를 공유할 수 있다는 우려 때문이다. 6일(현지시간) 더버지 등 외신에 따르면, 스택오버플로우는 사용자가 ‘챗GPT’를 이용해 AI로 생성한 답변을 공유하는...