네이버 이미지검색의 진화 – 딥러닝 이미지 분석 기술, 문서 검색 기술, 대규모 데이터 처리 기술의 조화
최근 스마트렌즈 등 이미지로 검색하는 이미지검색 서비스가 사용자들에게 새로운 검색 경험을 제공하며 많은 사랑을 받고 있습니다. 그러나 문서 검색 기술에 기반해 텍스트로 이미지를 찾는 이미지검색 (이하 ‘이미지검색’) 서비스 또한 일평균 1,500만 여개의 질의를 처리하며 여전히 수많은 사용자들의 요구를 처리하고 있습니다. 이미지검색은 웹/뉴스/동영상과 함께 가장 기본이 되는 검색 서비스입니다. 최근 인공지능 기반 챗봇이나 QA시스템이 각광 받으면서 이미지검색의 중요성은 날로 높아져 가고 있습니다. A.I. 및 챗봇 기반 이미지검색 결과의 예 네이버 이미지검색은 최고의 컨텐츠 유통 플랫폼인 네이버의 자체 이미지들 뿐만 아니라 좋은 이미지 소스를 가지고 있는 일부 외부 사이트의 이미지도 수집 기술과 제휴를 통해 선별적으로 검색결과에 반영해 왔습니다. 그러나 기존의 이미지검색은 일부 주제의 질의들에 대해서는훌륭한 검색결과를 제공해 주지만, 좋은 이미지를 가지고 있는 수많은 외부 출처의 이미지까지 전부 검색해 주지는 못하는 한계점을 가지고 있기도 했습니다. 그래서 네이버 이미지검색은 수집 기술 강화 프로젝트인 그리핀 프로젝트를 통해 수집된 수많은 웹문서 내 이미지들을 네이버 이미지검색에 반영하여 글로벌 서비스 사용으로 눈높이가 높아진 사용자의 검색 니즈를 만족시키기 위한 프로젝트를 진행하였습니다. 이미지검색을 만드는 기술 – 이미지 분석, 빅데이터 처리, 문서 검색 기술 네이버 이미지검색 서비스가 웹이미지검색 서비스로 진화하기 위해서는 여러 도전과제들이 있습니다. 웹문서 내 이미지를 추가하기 이전에도 네이버 이미지검색은 네이버의 다양한 탭검색 서비스 중 가장 많은 색인 건수를 기록하고 있었으며, 이를 효과적으로 가공하고 검색하기 위해 어떤 서비스보다 많은 기술들을 사용하고 있습니다. 뿐만 아니라 글로벌 서비스 대비 사용자의 유해 이미지에 대한 엄격한 기준, 수많은 스팸들로부터 고품질 이미지를 고르기 위한 이미지 분석도 필요합니다. 이렇게 가공하고 분석된 이미지에 대한 정보들이 사용자의 요구에 맞게 효과적으로 정렬될 수 있도록 검색 품질도 개선되어야 합니다. 이미지검색 개발에 필요한...