[AI타임스] 구글, 전문가급 디테일에 빠른 속도 더한 ‘나노 바나나 2’ 출시
(사진=구글)
구글이 전문가급 수준의 디테일과 빠른 생성 속도를 구현한 ‘나노 바나나 2(Nano Banana 2)’를 선보였다.
구글은 26일(현지시간) ‘제미나이 3.1 플래시 이미지(Gemini 3.1 Flash Image)’, 일명 나노 바나나 2를 전 세계에 동시 출시한다고 발표했다.
이 모델은 제미나이 앱 무료 및 유료 요금제에서 기존의 ‘나노 바나나 프로’를 대체한다. 또 AI 모드와 구글 렌즈 등 구글 검색에도 적용된다. 또 AI 스튜디오 및 버텍스 AI에서 API 미리보기로 제공되며, 안티그래비티에서도 사용할 수 있다. 동영상 스튜디오 ‘플로우’와 구글 애즈에서도 출시됐다.
구글은 이 모델을 ‘속도’와 ‘정교함’을 모두 잡기 위해 설계됐다고 설명했다.
우선 제미나이의 실제 세계 지식 기반을 활용하고, 웹 검색 기능을 통해 최신 정보나 특정 장소, 실존하는 사물을 더 정확하게 묘사할 수 있게 됐다.
특정 주제를 더 정확하게 표현한다. 이를 통해 인포그래픽이나 다이어그램 변환, 데이터 시각화 등의 장점을 더 강화했다고 전했다.
이전 모델보다 생성 속도가 비약적으로 향상, 빠른 이미지 생성이 가능하다고 강조했다. 또 머리카락 한 올과 피부의 질감, 복잡한 패턴의 직물 등 전문가급 사진에서 볼 수 있는 디테일을 구현한다. 실사 사진부터 유화, 3D 렌더링, 픽셀 아트까지 다양한 스타일을 커버한다.

인포그래픽 생성 예 (사진=구글)
이미지 내에 포함되는 글자(타이포그래피)도 향상됐다. 필요한 위치에 오타 없이, 다양한 언어로 배경과 어우러지는 디자인으로 삽입하는 텍스트 렌더링 능력을 갖췄다.
또 단일 워크플로우에서 최대 5명의 캐릭터의 유사성과 최대 14개의 사물의 사실성을 유지, 스토리보드를 작성과 내러티브 구성에도 강점을 보인다.

14개의 사물을 적용한 이미지 (사진=구글)
512px부터 4K까지 다양한 화면 비율과 해상도를 제어, 동일한 이미지를 세로형 소셜 미디어 게시물부터 와이드스크린 배경 화면까지 다양한 크기로 변형할 수 있다.

다양한 비율 지원 (사진=구글)
개발자들은 나노 바나나 2를 통해 더 유연하고 강력한 AI 앱을 구축할 수 있다고 소개했다.
효율적인 API 구조로, 모델 크기는 최적화됐지만 성능은 유지해 클라우드 비용 절감과 응답 시간 단축을 돕는다. 또 특정 브랜드의 스타일이나 고유한 데이터셋에 맞춰 모델을 미세조정하기 용이하다고 밝혔다.
일반 사용자도 이미지를 생성한 뒤, “배경을 더 밝게 해줘”나 “등장인물의 옷을 바꿔줘” 같은 추가 요청을 통해 이미지를 반복적으로 수정할 수 있다. 특히 프롬프트를 직관적으로 개선, 복잡한 기술 용어 없이 일상적인 언어로 명령해도 사용자의 의도를 정확히 파악해 시각화하는 것을 강점으로 꼽았다.

Elo 스코어 비교 (사진=구글)
이 모델은 자체 ‘텍스트-이미지’ 벤치마크에서 전체 선호도, 시각적 품질, 인포그래픽 및 사실성 등 3분야의 사용자 선호도 비교 평가(Elo) 점수에서 기존 나노 바나나를 뛰어넘은 것은 물론, 오픈AI의 ‘GPT-이미지 1.5’와 바이트댄스의 ‘시드림 5.0 라이트’, xAI의 ‘그록 이매진 이미지’ 등을 모두 큰 점수 차로 앞섰다.
또 구글은 최첨단 신스ID(SynthID) 기술과 상호 운용 가능한 C2PA 콘텐츠 자격 증명을 결합, 출처 추적을 강화했다고 밝혔다. 즉 보이지 않는 신스ID 워터마크와 함께 AI로 생성된 콘텐츠임을 표시하는 눈에 보이는 워터마크를 사용한다.
참고

프롬프트: 대한민국의 재활용 분리수거 방법을 안내 이미지로 만들어줘. 인포그래픽 스타일로

임대준 기자
출처: https://www.aitimes.com/news/articleView.html?idxno=207329