[BylineNetwork] 이미지만 보고 현실 3D 세계 ‘상상’해 추론하는 ‘마인드저니’
2D 이미지로 3차원 공간(3D)을 ‘상상’해 탐색할 수 있도록 지원하는 새로운 AI 에이전트 프레임워크 ‘마인드저니’가 공개됐다. 기존 시각언어모델(VLM)이 공간을 전체적으로 이해하지 못하는 한계를 극복할 수 있다고 연구진은 강조했다. 마이크로소프트는 20일 AI가 “오른쪽 소파에 앉아 의자를...
by OneLabs
2D 이미지로 3차원 공간(3D)을 ‘상상’해 탐색할 수 있도록 지원하는 새로운 AI 에이전트 프레임워크 ‘마인드저니’가 공개됐다. 기존 시각언어모델(VLM)이 공간을 전체적으로 이해하지 못하는 한계를 극복할 수 있다고 연구진은 강조했다. 마이크로소프트는 20일 AI가 “오른쪽 소파에 앉아 의자를...
800억 규모 정부 사업 따내…80%가 해외 이용자인 ‘페르소닷에이아이’ 앞세워 공략 이스트소프트가 인공지능(AI) 더빙 기술로 한류 콘텐츠의 해외 현지화를 본격화한다. 자체 AI 기술을 통해 원작의 감성을 살린 더빙을 제공해 자막보다 더빙을 선호하는 해외 시청자층을...
AI가 번역한 기사 원어민 감수·한국인 편집자 재검증 하루 기사 10개 안팎 올려… “기대 이상 접속자 발생” 연합뉴스가 인공지능(AI)을 활용한 베트남어 뉴스 서비스(vi.yna.co.kr)를 시작했다. 연합뉴스가 제작한 국문·영문 기사를 AI가 번역한 게 핵심이다. 기사...
구글, ‘픽셀 10’ 주요 기능으로 통화 중 실시간 통역 소개 학습한 화자 음성으로 번역…자연스러운 대화 경험 제공 https://www.youtube.com/watch?v=J43pCl9CJTs&t=1s “안녕, 캐런? 제 말 들려요? (Hi, Karen, can you hear me? Does this work?)” “(AI 통역)...