[AI Times] 구글, 가성비 앞세운 ‘비오 3.1 라이트 공개…’포스트 소라’ 겨냥
구글이 영상 생성 AI의 가장 큰 진입 장벽으로 꼽혀온 ‘비용 문제’를 정면으로 겨냥한 저가형 모델 ‘비오 3.1 라이트(Veo 3.1 Lite)’를 선보이며 시장 판도 변화에 나섰다. 이는 오픈AI가 ‘소라’ 서비스를 중단한 시점에 등장, 눈길을 모았다.
구글은 1일(현지시간) 기존 ‘비오 3.1 패스트(Fast)’ 대비 절반 이하의 비용으로 동일한 생성 속도를 제공하는 ‘비오 3.1 라이트’를 공개했다.
가격 구조는. 720p 기준 초당 0.05달러, 1080p 기준 초당 0.08달러로 책정돼, 기존 모델 대비 비용 부담을 크게 낮췄다. 이는 영상 생성 비용이 분당 수 달러에 달하던 기존 시장 환경을 고려할 때, 광고 자동 생성이나 소셜미디어 콘텐츠 제작 같은 대량 활용 사례를 가능하게 하는 수준이라는 평가다.
현재 비오 3.1 라이트는 제미나이 API와 구글 AI 스튜디오의 유료 플랜을 통해 사용할 수 있다. 구글은 4월 7일부터 상위 모델인 패스트의 가격도 추가로 인하할 계획이다. 이를 통해 영상 생성 AI의 전반적인 진입 장벽을 낮추고, 개발자들이 쉽게 영상 기능을 제품에 통합할 수 있도록 하겠다는 전략이다.
비오 3.1 라이트는 텍스트를 영상으로 변환하는 ‘텍스트-투-비디오(Text-to-Video)’와 이미지를 기반으로 영상을 생성하는 ‘이미지-투-비디오(Image-to-Video)’ 기능을 모두 지원한다.
해상도는 720p와 1080p를 지원하며, 가로형(16:9)과 세로형(9:16) 포맷 모두에 대응한다. 영상 길이도 4초, 6초, 8초로 조절할 수 있어 다양한 서비스 환경에 유연하게 적용 가능하다.
기술적으로는 ‘디퓨전 트랜스포머(DiT)’ 아키텍처를 기반으로 한다. 기존 U-Net 기반 확산 모델과 달리, 영상 프레임을 개별 이미지가 아닌 시간 축을 포함한 토큰 시퀀스로 처리해 객체, 조명, 질감 등의 일관성을 유지하는 데 강점을 보인다. 또 픽셀이 아닌 압축된 잠재 공간(latent space)에서 연산을 수행해 계산 효율성과 메모리 사용량을 동시에 개선했다.
구글 딥마인드의 ‘신스ID(SynthID)’ 기술을 적용해 AI 생성 콘텐츠에 보이지 않는 워터마크를 삽입함으로써 기업 환경에서 요구되는 신뢰성과 규제 대응 기능도 강화했다.

이 같은 구글의 행보는 영상 생성 AI 시장의 근본적인 한계를 겨냥한 것이다. 그동안 해당 시장은 높은 비용과 불안정한 수익성 때문에 실제 서비스 적용이 어려웠다.
실제로 이를 상징적으로 보여준 사례가 바로 오픈AI의 소라다. 소라는 출시 초기 큰 관심을 받았지만, 사용자 감소와 낮은 수익성 문제를 극복하지 못하고 결국 서비스 종료 수순에 들어갔다. 누적 매출은 약 140만달러에 그친 반면, 챗GPT는 같은 기간 19억달러를 기록하며 극명한 대비를 보였다.
구글은 이를 의식한 듯, 28일에는 X를 통해 “여전히 제미나이에서는 비디오를 만들 수 있다”라는 영상을 올렸다.
이처럼 소라의 퇴장은 경쟁사들에게 기회로 작용하고 있다. 중국 콰이쇼우의 ‘클링(Kling) AI’는 발표 직후 사용자 수가 증가하며 빠르게 시장 영향력을 확대했다. 이미 월간 사용자 수에서 소라를 크게 앞선 상태이며, 가격 경쟁력과 빠른 기능 개선을 바탕으로 연간 매출도 두 배 이상 성장할 것으로 전망된다.
미국 스타트업들도 반사이익을 누리고 있다. 런웨이ML(RunwayML)과 비두(Vidu) 역시 사용자 증가세를 보이며 투자 유치에 성공했다. 이들은 크리에이터와 마케팅 분야에서 급증하는 영상 콘텐츠 수요를 흡수하며 입지를 넓히고 있다.
현재 시장은 구글을 비롯해 메타, xAI 등 빅테크와 중국 기업, 스타트업이 혼재하는 다극 경쟁 구도로 재편되고 있다. 특히 중국 기업들은 가격 경쟁력을 앞세워 빠르게 사용자 기반을 확보하며 시장 판도를 흔들고 있다.
박찬 기자 cpark@aitimes.com
출처 : https://www.aitimes.com/news/articleView.html?idxno=208700&page=2&total=32082