
구글(Google)이 자사의 최신 인공지능(AI) 이미지 생성기 ‘이마젠 3(Imagen 3)’를 모든 제미나이(Gemini) 사용자들에게 무료로 제공하기로 했다. 제미나이는 구글이 개발한 대형언어모델(LLM) 기반의 AI 플랫폼이다.
이를 통해 모바일이나 데스크톱을 사용하는 모든 사용자들은 제미나이를 이용해 이미젠 3의 강력한 기능을 활용할 수 있게 되었다. 이미젠 3는 멀티모달로 텍스트를 이미지로 바꾸는 능력이 탁월하며, 사진처럼 사실적인 이미지부터 예술적인 그림까지 다양한 스타일을 소화할 수 있다.
제미나이 웹사이트 또는 앱에서 원하는 이미지에 대한 설명을 텍스트로 입력하면 이미젠 3가 이를 분석하여 이미지를 생성한다. 사용자는 제미나이를 통해 무료로 다양한 이미지를 생성할 수 있지만, 사람의 이미지를 생성하기 위해서는 유료 구독자인 제미나이 어드밴스드(Gemini Advanced) 사용자여야 한다. 또, 구글 원(Google One) AI 프리미엄 플랜의 일부로 제공되며, 2TB의 저장 공간과 구글 문서(Google Docs) 내 제미나이 기능도 포함된다.

구글은 이마젠 3를 자사의 최고 품질 이미지 생성 모델로 소개하면서, 이전 모델들보다 사용자 지시를 더 정확히 따르고 시각적 오류가 적다고 강조했다. 동물이나 풍경 같은 이미지 생성에는 제약이 없으며, 생성된 이미지는 원하는 만큼 다운로드가 가능하다. 생성된 이미지는 2048×2048 해상도의 JPEG 파일로 제공된다. 일일 생성 제한 없이 사용자들이 원하는 만큼 생성할 수 있다는 점도 큰 장점이다.
이마젠 3의 작동 방식은 단순하면서도 효과적이다. 사용자가 입력한 요청에 따라 이미지를 생성하며, 필요할 경우 요청을 수정하거나 재요청하여 이미지를 더 정교하게 다듬을 수 있다. 구글은 이를 통해 사용자가 사진과 같은 사실적인 풍경, 풍부한 질감을 표현한 유화, 클레이 애니메이션과 같은 다양한 스타일의 이미지를 생성할 수 있도록 한다고 설명했다. 이러한 기능 덕분에 이미젠 3는 매우 다양한 표현 방식을 제공하며, 사용자들은 자신만의 독특한 이미지 창작이 가능하다.
특히 이번 모델은 텍스트 표현 능력에서 두드러진 개선을 보여준다. 예를 들어, 만화책 패널에서 말풍선을 포함한 장면을 생성하거나 건물에 새겨진 글자를 요청하는 등, 다양한 텍스트 기반의 이미지를 더 나은 품질로 만들어낼 수 있다. 그러나 구글은 여전히 텍스트 렌더링에 있어 일부 제한적인 부분이 남아 있다고 추가적인 개선이 필요함을 인정했다.
구글은 이마젠 3가 여러 AI 모델들과의 비교 테스트에서 높은 사용자 만족도를 기록했다고 강조했다. 이는 달리(DALL-E) 3, 미드저니(Midjourney) v6, 스테이블 디퓨전(Stable Diffusion) 등 경쟁 모델과의 비교에서도 우위를 점하고 있음을 보여주는 결과라고 밝혔다.