(사진=아카이브)
(사진=아카이브)

사람과 기계를 구별하는 보안기술 ‘캡차(CAPTCHA)’를 인공지능(AI)이 100% 우회할 수 있다는 연구 결과가 나왔다.

톰스하드웨어는 28일(현지시간) 취리히 연방 공과대학교 연구진이 사람인지 컴퓨터 프로그램인지를 판별해주는 캡차 기술을 100%의 확률로 뚫는 이미지 인식 모델에 관한 논문을 아카이브에 게재했다고 보도했다.

이에 따르면 핵심은 캡차에 자주 등장하는 이미지를 AI 모델에 학습, 패턴을 파악하는 것이다.

연구진은 1만4000개의 레이블이 지정된 교통 이미지로 미세조정한 ‘욜로(YOLO)’ 객체 인식 모델을 사용, 구글의 ‘리캡차 v2(reCAPTCHA v2)’를 인간 수준인 100%의 성공률로 우회할 수 있었다고 전했다.

이미지 인식 모델 학습 외에도 연구진은 리캡차 v2 시스템을 속이기 위해 추가 조치를 도입했다. 예를 들어, 동일한 IP 주소에서 반복된 시도를 감지하지 않도록 VPN을 사용했고, 인간이 마우스를 작동하는 것처럼 보이도록 마우스 컨트롤 모델도 개발했다. 또 자동화된 에이전트가 인간처럼 보이도록 실제 웹 브라우징 세션에서 수집한 가짜 브라우저 및 쿠키 정보를 사용했다.

객체 유형에 따른 YOLO 모델의 캡차 이미지 인식 정확도 (사진=아카이브)
객체 유형에 따른 YOLO 모델의 캡차 이미지 인식 정확도 (사진=아카이브)

그 결과, YOLO 모델은 개별 캡차 이미지를 인식하는 비율이 달랐다. 캡차에 자주 등장하는 오토바이는 69%, 소화전은 100%까지 정확도를 보였다.

이를 바탕으로 추가 조치를 결합, 캡차 시스템을 매번 성공적으로 통과할 수 있었다고 전했다. 일부의 경우에는 인간보다 통과율이 떨어지기는 했지만, 차이가 통계적으로 유의미한 정도는 아니라는 설명이다. 인간도 캡차에서 가끔 실수가 발생하기 때문이다.

그동안 이미지 인식 모델을 사용해 리캡차를 해결하려는 시도는 몇차례 있었다. 하지만, 성공률은 68~71%에 머물렀다.

하지만 캡차를 개발한 구글은 이번 실험에 사용된 v2가 아닌, v3를 이미 적용하고 있다는 것이 문제다. 리캡차 v3은 단순한 이미지 매칭이 아닌, 사용자 상호작용을 분석하는 비시각적인 시스템이다. 따라서 v3를 적용하는 사이트에서는 이번 연구 결과가 통하지 않는다.

구글 클라우드 대변인은 “우리는 고객이 사용자 보호를 시각적 문제 해결 없이 할 수 있도록 돕는 데 매우 집중하고 있으며, 그래서 2018년 리캡차 v3를 출시했다”라고 말했다. 

그러나 AI 시스템이 인간만이 수행할 수 있다고 여겨졌던 작업들을 점점 더 잘 모방하게 됨에 따라, 사용자가 실제로 사람인지 확인하는 것이 점점 더 어려워질 수 있다는 지적이다.

연구진은 “어떤 의미에서 좋은 캡차는 가장 지능적인 기계와 가장 지능이 낮은 인간 사이의 정확한 경계를 표시한다”라며 “AI 모델이 인간의 능력에 가까워짐에 따라, 좋은 캡차를 찾는 것이 더 어려워졌다”라고 말했다.

 

출처 : https://www.aitimes.com/news/articleView.html?idxno=163828