[디지털투데이][Tech Insight]엔비디아는 왜 LLM을 계속 개발할까?
[디지털투데이 황치규 기자] 엔비디아는 오픈AI가 챗GPT를 내놓기 전인 2021년부터 ‘네모트론(Nemotron)’이란 이름 아래 거대 언어 모델(LLM) 프로젝트를 진행하고 있다.
모델 개발사에 GPU를 파는 입장에서, 자체 LLM까지 구축하는 것이 이례적으로 보일 수 있지만 엔비디아의 엔터프라이즈 생성형 AI 소프트웨어 부문 카리 브리스키 부사장은 나름 할말이 있다.
테크 팟캐스트 및 뉴스레터 ‘빅테크놀로지’를 운영하는 알렉스 칸트로위츠(Alex Kantrowitz)에 따르면 브리스키 부사장은 최근 인터뷰에서 “LLM 분야 존재감은 기반 기술 개발 능력의 토대”라고 강조했다.
기반 기술을 제대로 이해하고 있어야 파트너들과 보다 분명하게 커뮤니케이션할 수 있다는 것이었다.
그는 “우리는 이러한 모델을 대규모로 훈련하는 방법과 추론을 통해 대규모로 실행하는 방법을 이해해야 한다”라며 “이를 통해 GPU 아키텍처뿐만 아니라 스토리지와 네트워킹에도 정보를 제공할 수 있다”고 말했다.
브리스키 부사장은 프레젠테이션을 준비할 때 AI 복제 음성으로 자신이 할 발표를 미리 들어본다. 노트를 AI 음성 클론에 업로드한 뒤, 실제 청중 입장에서 발표를 경험해 보는 방식이다. 브리스키는 이 과정을 통해 발표 내용을 평가하고 다듬으며, 이는 단순한 실험이 아닌 엔비디아 내부에서 매우 자연스러운 일이다. LLM 개발도 이같은 맥락에서 해석될 필요가 있다는 설명이다.
네모트론 모델들은 오픈소스로 공개된다. 여기에는 훈련 데이터까지 포함된다. 특히 메타 라마(Rama) 모델 요소를 적용한 네모트론 울트라는 2530억개 매개변수를 갖고 있다.
엔비디아 거대 언어 모델은 AWS 같은 클라우드 제공업체와 웹상에서 이용 가능하지만, 브리스키는 네모트론이 대형 파운데이션 연구 회사들과 경쟁하기 위한 것이 아니라고 강조한다. 그는 “우리는 AGI(인공일반지능)를 목표로 하지 않는다”라며 “이미 그 분야를 시도하는 모델 개발사들이 충분히 많다고 생각한다“고 말했다.
오픈소스 전략을 통해 엔비디아는 기술 채택률 확대라는 효과도 얻고 있다. 생성형 AI를 도입하려는 기업들은 자신들 사용 사례에 맞는 맞춤형 모델을 필요로 하며, 오픈소스 LLM은 이를 가능하게 해준다. 결과적으로 이는 엔비디아 GPU와 시스템에 대한 수요 증가로 이어진다.
이 전략은 이미 현실에서 효과를 보고 있다. AI 검색엔진 퍼플렉시티는 네모트론 기반 기법으로 모델 최적화를 진행했고, 서비스나우는 기업용 AI 개발에 네모트론 추론 기술을 활용 중이다.
엔비디아는 자율주행 기술 프로그램 일환으로 캠퍼스와 베이 에어리어를 주행하는 자체 자율주행 차량도 보유하고 있다. 브리스키 부사장은 “경쟁을 위한 것이 아니다. 단순히 이해하기 위한 것이다. 학습 과정이다. 우리는 배워야 한다”라고 말했다. 또 “우리는 엔드투엔드(end-to-end)로 시스템을 구축한 후 이를 분해하고 분석해야 한다. 그래야 파트너사와 대화할 때 우리가 무슨 말을 하는지 정확히 알 수 있다“고 거듭 강조했다.
출처 :
https://www.digitaltoday.co.kr/news/articleView.html?idxno=597963