AI/가상비서 / 개인화 / 동영상 / 분석/동향 / 온라인 광고 / 유료화 / 챗봇

[TechM] [테크M 이슈] 뛰는 구글에 나는 오픈AI…AI 모델 경쟁 불 붙었다

by 민호 최 · 2024-02-16

인공지능(AI) 시장 패권을 둘러싼 구글과 오픈AI 간의 쫓고 쫓기는 경쟁이 더욱 치열하게 펼쳐지고 있다. 구글은 GPT 모델 견제를 위해 초거대 멀티모달 AI ‘제미나이’ 모델 강화를 서두르고 있고, 오픈AI는 동영상 생성형 AI 모델 ‘소라(Sora)’를 공개하며 영역 확장에 나섰다.

1시간 동영상 통째로 분석 ‘제미나이 1.5’

15일(현지시간) 구글은 자체 개발한 멀티모달 AI 모델 ‘제미나이 1.0 프로’의 업데이트 버전 ‘제미나이 1.5 프로’를 공개했다. 기존의 1.0 프로에 비해 동시에 처리할 수 있는 정보양을 크게 늘리고 문맥을 이해하는 역량도 강화했다. 구글 내부 테스트 결과에 따르면 제미나이 1.5 프로가 기존 제미나이 1.0 프로 대비 87% 더 향상된 성능을 나타냈다.

구글 제미나이는 학습양에 따라 ‘울트라’, ‘프로’, ‘나노’로 구분된다. 중형 모델에 속하는 제미나이 1.5 프로는 지난주 선보인 ‘제미나이 1.0 울트라’와 비견한 성능을 자랑한다. 순다 피차이(Sundar Pichai) 구글 및 알파벳 최고경영자(CEO)는 “제미나이 1.5 프로는 이미 공개 준비가 완료됐으며, 다양한 부문에서 놀라운 발전을 이뤘다”며 “더 적은 컴퓨팅 자원으로 제미나이 1.0 울트라에 필적하는 성능을 갖췄다”고 전했다.

제미나이 1.5 프로의 토큰 처리 규모는 최대 100만개에 달한다. 기존 1.0 프로의 3만2000개는 물론, 오픈AI
‘GPT-4 터보’의 12만8000개를 훌쩍 뛰어넘는 규모로 1시간 분량의 동영상과 음성 11시간, 코드 3만줄, 단어 70만개 등의 방대한 정보를 한 번에 처리할 수 있다. 우주선 아폴로 11호와 관련된 402페이지 분량의 기록을 제미나이 1.5 프로에 입력하면, 문서 전반에서 발견되는 모든 자세한 정보들과 대화, 사건, 이미지 등을 종합해 추론해 낸다. 또 44분 분량의 미국 배우 버스터 키튼의 무성 영화를 입력했더니, 정확하게 주요 줄거리 포인트와 사건들을 분석 하며 자칫 놓칠 수 있는 영화 내 사소한 디테일까지도 추론해 냈다.

구글은 프리뷰 버전으로 100만개 토큰 콘텍스트 윈도를 제공하며, 실제 출시는 기본 12만8000개 토큰 콘텍스트 윈도를 기본으로 필요시 추가 요금을 내고 사용하도록 할 예정이다.

텍스트 입력하면 영상이 뚝딱 ‘소라’

구글이 추격의 고삐를 죄는 사이 오픈AI는 텍스트와 이미지를 넘어 영상으로 생성형 AI 활동 영역 확장에 나섰다. 사용자가 간단한 텍스트를 입력하면 이를 60초 분량의 동영상으로 만들어주는 텍스트-투-비디오(text-to-video) 모델인 ‘소라(Sora)’가 주인공이다. 오픈AI 측은 “여러 캐릭터와 특정 유형의 동작, 복잡한 장면 등 최대 1분 길이의 동영상을 빠르게 제작할 수 있다”며 “언어에 대한 깊은 이해를 갖고 있어 프롬프트를 정확하게 해석하고 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다”고 설명했다.

"한 세련된 여성이 네온사인과 간판으로 가득한 도쿄 거리를 걷고 있다. 그녀는 검은색 가죽 재킷, 긴 빨간색 드레스, 검은색 부츠를 신고 검은색 지갑을 들고 있으며, 선글라스를 쓰고 빨간 립스틱을 바르고 있다. 그녀는 자신감 있고 자연스럽게 걷는다. 길은 축축하고 반사된 화려한 조명이 거울 효과를 만들어 내며, 많은 보행자가 걸어다니고 있다." 이 같은 프롬프트를 '소라'에 입력해 생성한 동영상 일부. /영상=오픈AI 블로그 — “한 세련된 여성이 네온사인과 간판으로 가득한 도쿄 거리를 걷고 있다. 그녀는 검은색 가죽 재킷, 긴 빨간색 드레스, 검은색 부츠를 신고 검은색 지갑을 들고 있으며, 선글라스를 쓰고 빨간 립스틱을 바르고 있다. 그녀는 자신감 있고 자연스럽게 걷는다. 길은 축축하고 반사된 화려한 조명이 거울 효과를 만들어 내며, 많은 보행자가 걸어다니고 있다.” 이 같은 프롬프트를 ‘소라’에 입력해 생성한 동영상 일부. /영상=오픈AI 블로그

이날 오픈AI는 소라로 생성한 다양한 영상을 공개했는데, 영화의 한 장면처럼 자연스럽고 디테일이 살아있는 고화질 영상으로 업계를 놀라게 했다. 실제 장면 같은 연출 뿐만 아니라 과거 영상, 애니메이션 영상 등 다양한 연출도 가능한 것으로 보인다. 또 텍스트 뿐만 아니라 정지 이미지를 가져와 동영상으로 생성할 수도 있고, 기존 동영상의 길이를 확장하거나, 누락된 프레임을 채우는 일도 가능하다.

오픈AI 측은 소라가 프롬프트를 통해 요청한 내용 뿐만 아니라 실제 세계에서 이런 사물들이 어떻게 존재하는 지 물리학적으로 이해하고 있다고 강조했다. 다만 복잡한 장면의 물리법칙을 정확하게 시뮬레이션하지 못하고, 인과관계를 이해하지 못하는 경우도 발생한다는 한계점도 적시했다. 이를 보완하기 위해 오픈AI는 시각 예술가와 디자이너, 영화 제작자 등 외부 전문가들에게 접근 권한을 부여해 피드백을 받으며 모델을 가다듬고 있다.

오픈 AI는 “소라는 실제 세계를 이해하고 시뮬레이션할 수 있는 모델의 기반이 될 것”이라며 “이는 일반인공지능(AGI)을 실현하는 데 중요한 이정표가 될 것으로 믿는다”고 전했다.

오픈AI 쫓는 구글의 속사정

지난해 오픈AI ‘챗GPT’ 등장으로 AI 분야의 주도권을 뺏길 뻔한 구글은 부랴부랴 추격에 나서 올초 ‘제미나이’로 관련 사업을 통합하며 본격적인 추격에 나서고 있다. 딥러닝과 트랜스포메이션 모델의 선구자인 구글은 제미나이를 통해 본격적인 실력발휘를 시작한 상황이다. 다만 AI로 ‘새 판’을 짜려는 오픈AI와 달리, 구글은 기존 사업과의 ‘자기잠식’에 대한 고민도 해야 하는 상황이다.

구글은 세계 검색 시장의 90% 이상을 차지하는 지배적 사업자다. 하지만 생성형 AI가 더 정교해짐에 따라 사용자들이 구글과 같은 전통적인 검색 엔진 대신 AI 기반 플랫폼으로 정보를 찾는 경우가 늘어날 수 있다. 이는 검색 트래픽의 감소로 이어지고, 결과적으로 검색 광고 수익의 감소로 이어질 수 있음을 의미한다. 지난 4분기 실적에서 광고 수익이 시장 기대치에 미치지 못하자, 이에 대한 우려로 구글 주가가 크게 흔들리기도 했다.

생성형 AI 기술이 디지털 광고 공간에 대햔 진입 장벽을 낮추면서 새로운 경쟁자들이 등장할 것이란 전망도 나온다. 개인화되고 효율적인 광고 타겟팅을 위해 AI를 활용하는 새로운 참여자들이 구글의 광고 시장 지배력에 도전할 수 있다는 얘기다. 또 AI 기술이 발전함에 따라 광고주, 플랫폼, 사용자 간의 전통적인 역학이 변화하면서, 플랫폼의 중개자 역할이 축소될 수 있다는 분석도 나온다.

이런 시장 우려에 대해 순다르 피차이 CEO는 지난 4분기 실적발표 컨퍼런스콜에서 “생성형 AI는 새로운 도구임은 분명하다”며 “하지만 검색의 폭과 깊이, 다양한 업종에 걸친 다양성, 웹의 풍부하고 다양한 콘텐츠 소스에 실제로 액세스하고 이 모든 것을 매력적인 방식으로 조합하는 안정성 등 검색에는 훨씬 더 많은 것이 있다”고 언급했다.

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

[TechM] [테크M 이슈] 뛰는 구글에 나는 오픈AI…AI 모델 경쟁 불 붙었다

You may also like...

답글 남기기 응답 취소

[TechM] [테크M 이슈] 뛰는 구글에 나는 오픈AI…AI 모델 경쟁 불 붙었다

You may also like...

[연합뉴스] “우리 정보 공짜수집·이용 안 돼”…늘어나는 챗GPT 차단 사이트

[Zdnet]유튜브, 시청자가 스토리 바꾸는 인터랙티브 콘텐츠 준비

[모바일 앱 동향] 한국경제, 매일경제

답글 남기기 응답 취소

TAG Cloud