Tagged: 양자화

[디지털투데이] 메타, 경량화된 양자화 ‘라마 3.2’ 출시…추론 속도 향상

[디지털투데이 AI리포터] 메타가 대규모언어모델 ‘라마 3.2’ 제품군 중 최초로 경량화된 양자화 모델을 출시했다. 25일 온라인 매체 기가진에 따르면 기존의 성능을 거의 유지하면서 추론 속도와 메모리 사용량이 크게 개선된 것이 특징이다. 메타는 지난달 26일 라마...