AI/가상비서 / 분석/동향

[ITWORLD] 미스트랄 AI, ‘미스트랄 라지 2’ 출시 “라마 3 405B 모델과 비슷한 성능”

by 득환 김 · 2024-07-26

미스트랄 AI가 1,230억 개의 파라미터를 보유한 LLM 미스트랄 라지2(Mistral Large 2, ML2)를 출시하며 오픈AI, 앤트로픽, 메타의 주요 경쟁자로서의 입지를 강화했다.

미스트랄 AI는 ML2가 128K 컨텍스트 창과 프랑스어, 독일어, 스페인어, 아랍어, 중국어, 일본어, 한국어를 포함한 수십 개의 언어를 지원한다고 밝혔다. 또한 파이썬, 자바, C, C++, 자바스크립트, 배시 등 80가지 이상의 코딩 언어를 지원한다.

이 발표는 메타가 가장 진보된 모델인 405B 모델(4,050억 개 파라미터)을 포함한 라마 3.1 제품군을 공개한 데 이은 것이다. 메타는 라마 3.1이 128K 컨텍스트 길이와 8가지 언어를 지원한다고 말했다. 오픈AI는 최근 가장 저렴한 소형 AI 모델인 GPT-4o 미니를 출시했다.

미스트랄 AI는 벤치마킹 결과 ML2가 코딩 및 추론 등 영역에서 GPT-4o, 클로드 3 오퍼스(Claude 3 Opus), 라마 3 405B와 같은 주요 모델과 동등한 성능을 보였다고 주장했다. 인기 있는 벤치마크 테스트인 MMLU에서 ML2는 84%, 라마 3.1 405B는 88.6%, GPT-4o는 88.8%의 점수를 얻었다. GPT-4o 미니는 82%를 기록했다. 미스트랄 AI 모델은 버텍스 AI, 애저 AI 스튜디오, 아마존 베드락, IBM 왓슨x.ai에서 사용할 수 있다.

ML2의 주요 특징

많은 전문가가 복잡한 수학, 고급 추론, 효율적인 코드 생성을 위해 노력하는 대화형 및 멀티모달 모델로 AI의 경쟁이 옮겨가고 있다고 말한다.

카운터포인트 리서치 공동 설립자 닐 샤에 따르면, 미스트랄 AI와 같은 주요 AI 기업은 착각을 최소화하고 추론 능력을 강화하며 모델의 크기 대비 성능을 최적화하는 데 주력하고 있다.

샤는 “ML2는 트레이닝 시 최대 16비트 정밀도에서 246GB의 메모리만 필요하기 때문에 크기당 더 많은 성능을 담을 수 있다는 점에서 탁월하다. 미스트랄 라지 2는 경쟁 제품보다 설치 공간이 더 작으면서 정밀도는 더 높기 때문에 기업에 유리하다. 더 많은 메모리와 컴퓨팅을 필요로 하는 다른 대형 모델보다 더 정확하고 간결한 상황별 응답을 더 빠르게 생성할 수 있다”라고 말했다.

또한 자바, 타입스크립트 또는 C++에 크게 의존하는 기업은 미스트랄 AI의 벤치마크가 주장하는 우수한 코드 생성 성능과 정확성의 이점을 누릴 수 있다고 샤는 덧붙였다.

테크아크(Techarc)의 수석 애널리스트인 파이살 카우사는 미스트랄과 같은 오픈소스 모델을 사용하면 특정 산업이나 지역에 맞는 특화된 LLM을 만들 수 있다고 설명했다.

이어 “결국에는 시간이 지나면서 이런 종류의 전문화된 LLM이 등장할 것이다. 생성형 AI는 유용하지만, 많은 경우 도메인에 대한 전문적 이해가 필요하다. 이는 LLM을 만들 때만 얻을 수 있다. 따라서 AI 모델을 사용하기 위한 LLM을 제공할 뿐만 아니라 이런 특정 플랫폼을 만들기 위한 조정 및 추가 개발이 가능한 오픈소스 플랫폼을 갖추는 것이 중요하다”라고 말했다.

포레스터 수석 애널리스트 찰리 다이는 코드 생성, 수학, 추론, 성능 및 비용 효율성 측면에서 단일 H100 노드에서 효율적으로 실행되도록 설계된 ML2의 고급 기능과 주요 클라우드 플랫폼에서의 다국어 지원과 폭넓은 지원이 기업의 AI 이니셔티브 경쟁력을 크게 강화할 것이라고 언급했다.

라이선스 및 기타 문제

사용자가 우려할 수 있는 점은 미스트랄이 연구 및 비상업적 목적으로만 사용 및 수정을 허용하는 미스트랄 리서치 라이선스에 따라 ML2를 출시한다는 점이다. 상업적 용도로 사용할 경우 별도의 상업용 라이선스를 취득해야 한다.

샤는 “미스트랄 AI는 ML2에 상당한 데이터와 학습 비용이 발생했을 것이므로 라이선스 없이 상업적으로 사용할 수 있는 범위를 당연히 축소하여 엄격한 상업용 라이선스를 요구했고, 이는 가격 상승의 원인이 될 수 있다. 신흥 시장과 같은 특정 지역에서는 걸림돌이 될 수 있다“라고 언급했다.

사이버미디어 리서치(Cybermedia Research)의 산업 연구 그룹 부사장인 프라부 람은 미스트랄 AI가 가능성과 잠재력을 보여주긴 했지만, 몇 가지 우려 사항이 남아 있다고 덧붙였다. 데이터 투명성, 모델 해석 가능성, 편향성 위험 등은 여전히 개선해야 할 중요한 영역이라고 지적했다.

출처 :

https://www.itworld.co.kr/news/345566

Tags: LLM ML2 멀티모달 미스트랄 미스트랄AI 생성형 AI

[ITWORLD] 미스트랄 AI, ‘미스트랄 라지 2’ 출시 “라마 3 405B 모델과 비슷한 성능”

You may also like...

답글 남기기 응답 취소

2026 4월
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

[ITWORLD] 미스트랄 AI, ‘미스트랄 라지 2’ 출시 “라마 3 405B 모델과 비슷한 성능”

ML2의 주요 특징

라이선스 및 기타 문제

You may also like...

[뉴시스] 얼굴에 비친 그늘, 가짜영상 잡는 단서…탐지기술 어디까지 왔나[딥페이크 두 얼굴④]

[서울경제] 네이버 블로그 올해 126만개 신설…1020세대 대거 유입

[신문과방송] 퓨리서치센터, 소셜 뉴스 이용 실태 보고서 : 여성은 페이스북, 남성은 레딧, 젊은 층은 스냅챗, 고학력자는 링크드인 이용률 높아

답글 남기기 응답 취소

TAG Cloud