[BylineNetwork] 이미지만 보고 현실 3D 세계 ‘상상’해 추론하는 ‘마인드저니’
2D 이미지로 3차원 공간(3D)을 ‘상상’해 탐색할 수 있도록 지원하는 새로운 AI 에이전트 프레임워크 ‘마인드저니’가 공개됐다. 기존 시각언어모델(VLM)이 공간을 전체적으로 이해하지 못하는 한계를 극복할 수 있다고 연구진은 강조했다. 마이크로소프트는 20일 AI가 “오른쪽 소파에 앉아 의자를...
by OneLabs
2D 이미지로 3차원 공간(3D)을 ‘상상’해 탐색할 수 있도록 지원하는 새로운 AI 에이전트 프레임워크 ‘마인드저니’가 공개됐다. 기존 시각언어모델(VLM)이 공간을 전체적으로 이해하지 못하는 한계를 극복할 수 있다고 연구진은 강조했다. 마이크로소프트는 20일 AI가 “오른쪽 소파에 앉아 의자를...
AI SW강자 모레, AI반도체 강자 텐스토렌트 AI 데이터센터 솔루션, 2025년 상반기 출시 소프트웨어와 칩의 확장성 시너지 쿠다 호환 솔루션 개발..엔비디아 칩 독점 사라져 짐 켈러, 모레 지분투자 아직..가능성 열려 있어 [이데일리 김현아 IT전문기자] 인공지능(AI)...
브이로거 (사진=구글) 구글이 스틸 사진 한장으로 사람들이 말하고, 몸짓을 하고, 움직이는 모습을 실감나는 동영상으로 생성할 수 있는 새로운 인공지능(AI) 시스템을 선보였다. 벤처비트는 18일(현지시간) 구글이 ‘브이로거(VLOGGER)’라는 새 AI 프레임워크를 공개했다고 보도했다. 온라인 아카이브에 게재된...
[디지털투데이 황치규 기자] 생성AI를 내부 시스템에 적용하려는 기업들이 늘면서 거대언어모델(LLM)을 보다 효과적으로 쓸 수 있도록 지원하는 기술들에 대한 대한 관심이 고조되고 있다. 개인 사용자들이야 챗GPT 같은 AI LLM 서비스들을 그냥 쓰면 되지만 기업들, 특히 규제 및 컴플라이언스를 신경쓰는...