[AI타임스] “트랜스포머 벽 넘어”…’맘바-3′, 메모리 절반으로 성능·속도 능가
맘바-2와 맘바-3 아키텍처 비교 (사진=arXiv) 트랜스포머(Transformer)의 대안으로 꼽히는 ‘맘바(Mamba)’ 아키텍처의 최신 모델이 등장했다. 성능과 속도가 모두 향상, 트랜스포머를 본격적으로 앞서게 된 것이 특징이다. 카네기멜론대학교와 프린스턴대학교 등 맘바 아키텍처 개발 연구진은 18일(현지시간) 최신 버전인 ‘맘바-3’를...
by OneLabs
맘바-2와 맘바-3 아키텍처 비교 (사진=arXiv) 트랜스포머(Transformer)의 대안으로 꼽히는 ‘맘바(Mamba)’ 아키텍처의 최신 모델이 등장했다. 성능과 속도가 모두 향상, 트랜스포머를 본격적으로 앞서게 된 것이 특징이다. 카네기멜론대학교와 프린스턴대학교 등 맘바 아키텍처 개발 연구진은 18일(현지시간) 최신 버전인 ‘맘바-3’를...
수학 전용 아닌 추론 방식 챗봇이 처음 달성 사람처럼 직접 문제 읽고 답을 내는 방식 문제 풀이 시간 사람과 같지만 비용 훨씬 커 [서울=뉴시스]호주에서 열린 국제수학올림피아드에 챗봇으로 참가한 구글의 딥마인드사 연구진들. (출처=딥마인드, 뉴욕타임스(NYT)에서 재인용)...
[디지털투데이 AI리포터] 아마존이 ‘노바'(Nova) 브랜드로 고급 추론(Reasoning) 기능을 갖춘 AI 모델을 개발 중이라고 4일(현지시간) 비즈니스인사이더가 전했다. 아마존은 구글, 오픈AI, 앤트로픽과 직접 경쟁하며, 기존 AI 대비 더 복잡한 문제 해결이 가능한 모델을 선보일 계획이다. 아마존은 AI 비용...