[AI Times] 구글, 동영상 모델 ‘비오 3.1’ 출시…’소라 2’와 평가 엇갈려
구글이 인기 동영상 생성 모델 ‘비오 3’의 업그레이드 버전을 내놓았다. 지난 5월 ‘I/O’에서 비오 3를 공개한 지 5개월여만이며, 9월30일 ‘소라 2’가 출시된 지 2주 남짓만이다.
구글은 15일(현지시간) AI 영상의 사실감과 편집 자유도를 개선한 ‘비오 3.1(Veo 3.1)’을 출시했다.
기존 버전에 비해 영상의 물리적 표현과 질감을 크게 개선했다. 사용자는 AI로 생성된 영상의 조명·그림자·물리 효과를 세밀하게 조정할 수 있으며, 영상 속 오브젝트를 자연스럽게 추가하거나 제거해 처음부터 없었던 것처럼 배경을 재구성할 수도 있다.
가장 큰 변화는 AI 오디오 생성 기능의 전면 통합이다. 이번 업데이트를 통해 사용자는 영상과 음향을 동시에 생성하거나 자연스럽게 확장할 수 있는 새로운 제작 경험을 얻게 됐다.
우선 ‘인그리디언트 투 비디오(Ingredients to Video)’ 기능은 3장의 이미지만으로 영상과 오디오를 동시에 만들어내며, 시각적 흐름과 음향적 분위기를 일관되게 구성한다. ‘프레임투 비디오(Frames to Video)’ 기능은 시작 이미지와 종료 이미지를 연결해 부드럽고 자연스러운 전환이 이루어지는 영상과 그에 어울리는 사운드를 동시 생성한다.
또 ‘장면 확장(Scene Extension)’ 기능은 기존 영상의 마지막 장면을 최대 1분까지 확장하면서 상황에 맞는 오디오를 자동으로 추가해, 한편의 완성된 영상처럼 이어지도록 한다.
이런 기능 통합으로 사용자는 별도의 후반 작업 없이도 톤과 감정, 스토리텔링이 유기적으로 어우러진 영상을 손쉽게 제작할 수 있게 됐다는 설명이다.
이번 모델은 플로우(Flow) 앱, 제미나이(Gemini) API, 버텍스 AI(Vertex AI)를 통해 제공되며, 기업 고객은 GUI 기반의 인터페이스나 프로그래밍 방식 중 선택해 워크플로에 맞게 통합할 수 있다.
가격은 이전 버전과 동일하게 유지됐다. 표준(Standard) 모델은 초당 0.40달러, 고속(Fast) 모델은 초당 0.15달러로 책정, 목적과 필요에 따라 옵션을 선택할 수 있다.
영상 해상도는 720p~1080p, 24fps, 길이는 기본 4~8초이며 ‘확장(Extend)’ 기능을 통해 최대 2분30초 이상으로 확장할 수 있다.
구글은 비오가 지난 5월 출시 이후 2억7500만건 이상의 영상이 제작될 정도로 폭발적인 반응을 얻고 있다고 전했다.
토마스 일리치 구글 랩스 제품관리 총괄은 “비오 3.1은 인간 영화 제작자의 사고방식에 가까운 기능을 제공한다”라며 “장면 구성, 컷 간 연속성, 오디오 조화 등 실제 영화 제작 과정을 AI로 자동화한다”라고 말했다.
이번 출시는 최근 소라 2가 큰 인기를 얻는 가운데 이뤄졌다. 따라서 비교가 많이 이뤄지고 있다.
업계 반응은 긍정적인 편이지만, 일부 전문가는 소라 2에 못 미친다고 평했다. AI 스타트업 하이퍼라이트의 맷 슈머 CEO는 “비오 3.1은 훌륭하지만, 품질 면에서는 소라 2보다 다소 인공적이며 가격도 비싸다”라고 밝혔다.
반면, 일부 크리에이터들은 “비오 3.1의 오디오 품질과 장면 확장 기능이 더 인상적”이라고 평했다.
출처 : AI타임스(https://www.aitimes.com)