Tagged: 언어모델

[AI타임스] 앤트로픽, LLM 내부 작동 방식 일부 파악…”사람처럼 실제 추론·추상화 실행”

앤트로픽이 그동안 ‘블랙박스’로 알려졌던 대형언어모델(LLM)의 내부 작동 방식을 분석하는 기술을 개발했다. 이를 통해 ‘클로드’의 작업 수행 과정을 지켜본 결과, 이제까지 알려지지 않았던 몇가지 특징을 찾아냈다고 전했다. 앤트로픽은 27일(현지시간) 인공지능(AI)이 작업을 수행할 때 활성화되는 경로를...

[매일경제] 작지만 똑똑한 AI … sLLM 시대 온다

비용은 적고 특정 성능 우수해 학계서 주목하고 개발 잇달아 스캐터랩, AI플랫폼 이어 42마루·스켈터랩스도 서비스 “챗GPT의 연산 비용이 눈물 날 정도다.”(샘 올트먼 오픈AI CEO) 오픈AI ‘GPT-4‘, 구글 ‘팜2’, 네이버 ‘하이퍼클로바X’와 같은 대규모언어모델(LLM) 주도권 경쟁이 벌어진...

구글, 스스로 디버깅하는 대규모 언어모델 개발

재학습 없이 스스로 정확도 높이는 LLM 개발 방법 논문 공개   구글이 대규모 언어모델(LLM) 스스로 디버깅해 정확도를 높이는 방식을 공개했다. 연구 결과 현재 최대 12%까지 정확도를 높였으며 이후 더욱 높은 효율을 기록할 수 있을...