
[AI타임스] 미드저니, 1년 만에 새 모델 ‘V7′ 출시…’사실적 이미지’ 최강자 자리 되찾나

사실적인 이미지 생성의 강자 미드저니가 1년 만에 새로운 모델을 선보였다. 지브리 스타일을 앞세운 챗GPT와 구글, 블랙 포레스트 랩스 등 그동안 등장한 경쟁자들을 제치고 지명도를 끌어 올릴 수 있을지 주목된다.
미드저니는 4일(현지시간) 홈페이지를 통해 최신 ‘V7’ 모델을 알파 버전으로 출시한다고 발표했다. 디스코드 채널에서 이날부터 테스트할 수 있다.
데이비드 홀츠 미드저니 CEO는 V7을 “완전히 다른 아키텍처”라며 “놀라운 모델”이라고 밝혔다.
또 “텍스트 프롬프트와 이미지 프롬프트를 훨씬 더 똑똑하고 환상적으로 반영하며, 아름다운 텍스처와 신체와 손, 물체 등의 세부적인 일관성 향상으로 이미지 품질이 눈에 띄게 높아졌다”라고 소개했다.
이번 버전의 가장 큰 특징으로 ‘개인화(personalization)’를 꼽았다. 모델을 개인적인 시각적 선호도에 맞게 조정하는 기능이다.
먼저 5분여에 걸쳐 200개의 이미지를 평가, 개인화 프로필을 만들어야 한다. 이처럼 V7은 기본적으로 개인화를 적용한 미드저니 최초의 모델이다.
‘드래프트 모드(Draft Mode)’라는 것도 주력 기능이라고 소개했다. 이는 비용이 절반이고 속도는 10배 빠른 이미지 생성 기능으로, 생각하는 것을 즉시 입 밖에 내면 이를 이미지에 적용해 준다. 즉, 아이디어를 가다듬는 좋은 방법이 될 수 있다는 설명이다.
드래프트 모드를 선택한 뒤 텍스트 프롬프트를 음성으로 바꾸면 된다. 생성된 이미지에 말로 명령을 입력, 조금씩 변경할 수 있다. 표준 모드보다 이미지 품질은 낮지만 지시 이행과 이미지 일관성이 뛰어나, 이미지 전체 품질을 향상하는 데 최적화된 방식이라고 전했다.
V7는 기본적으로 ‘터보(Turbo)’와 ‘릴렉스(Relax)’ 두가지 모드로 출시된다. 터보는 기존 V6에 비해 2배 정도 비싸다. ‘표준(Standard)’ 모드는 현재 최적화 중으로, 2개월 내 출시될 예정이라고 밝혔다.
추후 1~2주마다 주요 기능을 추가할 예정이다. ‘캐릭터’와 ‘객체 참조’가 가장 큰 업데이트라고 예고했다. 업스케일링이나 편집, 리텍스처링 등도 업그레이드한다.
정식 출시 전까지 데모 사이트와 피드백 사이트를 열고, 사용자 의견을 모집한다.
미드저니는 “V7은 독특한 강점과 몇가지 약점이 있는 완전히 새로운 모델”이라며 “하지만 기존과는 다른 스타일의 프로프트가 필요할 수 있다”라고 덧붙였다.
한편, V7는 챗GPT 네이티브 이미지 생성이 화제가 된 지 일주일 만에 등장했다. 일부 테스터는 지브리 스타일을 잘 생성하는 것은 아니지만, 사실적인 이미지 생성에서는 여전히 최고 수준이라고 평했다.
미드저니는 지난해 1월 ‘V6’를 출시한 뒤 이미지 편집 기능을 몇차례 선보였을 뿐, 주력 기능 업데이트는 드물었다. 대신 하드웨어로 사업을 준비하거나, 최근에는 창의적 글쓰기를 위한 LLM 훈련법 연구 결과를 내놓는 등 다른 분야 확장에 집중했다. 그동안 블랙 포레스트 랩스나 구글이 사실적 이미지 생성에 뛰어난 모델을 선보였다.
챗GPT의 지브리 열풍으로 이미지 생성에 대한 관심이 그 어느 때보다 높아진 상태다. V7이 미드저니의 저변을 넓히는 데 도움이 될지 주목된다.
임대준 기자
출처 : https://www.aitimes.com/news/articleView.html?idxno=169374