[아주경제]네이버, 언론사 신뢰도 평가해 검색 우선순위 판단…“어뷰징 원천 차단”
개편 요약 : 콘텐츠 생산자가 어뷰징을 시도할 경우 랭킹 알고리즘에 반영하여 네이버 검색 결과에서 배제.
대상 : 뉴스 및 UGC(사용자 제작 콘텐츠)
어뷰징 시도
- 이슈와 관계없는 내용을 담은 콘텐츠를 생산하는 경우
- 다른 생산자와 유사한 이슈의 내용을 다룬 콘텐츠를 뒤늦게 생산하는 경우
- 관련도가 떨어지는 모든 키워드를 포함하는 경우
개선 내용
- 콘텐츠 생산자가 어뷰징을 시도할경우 어뷰징의 규모, 빈도를 분석하여 새로운 피쳐를 생성, 콘텐츠 생산자의 신뢰도값에 반영.
- 신뢰도 값을 랭킹알고리즘에 반영하여 네이버 검색 최신순/관련도 순 정렬 우선 순위에서 배제.
- 신뢰도는 매일 업데이트 되어 일정 기간 어뷰징 시도 중단시 회복
개편 시점 : 별도 공개 하지 않음.
—————————————————————————————————————————————————————–
네이버 공식 블로그 : 콘텐츠 생산자의 신뢰도를 평가하는 피쳐(Feature)가 더욱 다양해집니다.
이용자들은 원하는 정보를 얻기 위해 네이버 검색창에 키워드를 입력한 후, 검색 결과를 통해 블로그, 포스트, 카페, 지식iN, 뉴스 등 키워드와 관련한 다양한 콘텐츠를 접하고 있습니다.
네이버는 이용자에게 더욱 믿을 수 있는 양질의 검색 결과를 제공하기 위해 검색 결과의 랭킹에 영향을 미치는 다양한 피쳐(Feature, 요소)들을 지속적으로 개발하여 알고리즘을 고도화하고 있는데요.
이번 개편에서는 UGC(사용자 제작 콘텐츠) , 뉴스 등 콘텐츠가 생산되는 패턴을 분석해, 이 분석 결과를 활용하여 어뷰징 시도를 사전에 방지하고, 이용자에게 신뢰할 수 있는 정보를 제공하고자 합니다.
| 어떤 콘텐츠들이 영향을 받나요?
실시간 급상승 검색어(이하 실급검)나 뉴스토픽과 같은 시의성이 높은 검색어 서비스나 이용자들이 자주 찾는 고빈도의 키워드를 활용해 어뷰징을 시도하는 등 저품질의 콘텐츠를 지속적으로 만들어내는 생산자들의 콘텐츠가 검색 결과에서 영향을 받게 됩니다.
네이버는 아래와 같은 행위를 어뷰징 시도로 판단하려고 합니다.
1) 이슈와 관계없는 내용을 담은 콘텐츠를 생산하는 경우
실급검이나 뉴스토픽에 노출되는 키워드와 관련된 다양한 콘텐츠를 살펴보면, 제목에 해당 키워드를 포함하고 있지만 정작 본문에는 왜 해당 키워드가 이슈화되었는지 사실관계를 파악하기 어렵고, 현재의 이슈와 관련없는 내용이 작성된 경우가 있습니다.
2) 다른 생산자와 유사한 이슈의 내용을 다룬 콘텐츠를 뒤늦게 생산하는 경우
일반적인 생산자들은 이슈가 발생할 경우 신속하게 해당 이슈를 조사하여 콘텐츠를 생산합니다. 하지만, 어떤 생산자들은 이슈에 대해 다른 생산자들과 유사한 내용의 콘텐츠를 뒤늦게 생산하는 경향을 보이는데요. 이러한 행동을 이슈 키워드마다 반복적으로 수행하는 양상은 콘텐츠 생산에 대한 노력없이, ‘최신성’이 검색 랭킹 알고리즘에서 중요한 기준이 되는 것을 악용하는 어뷰징 시도일 가능성이 높다고 볼 수 있습니다.
3) 관련도가 떨어지는 모든 키워드를 포함하는 경우
실급검에는 학기가 시작할 때 ‘XX대학교 수강신청’이나 월급날 즈음 ‘OO은행’과 같이, 이슈가 아닌 주기적으로 돌아오는 보통의 키워드가 노출되기도 하는데요. 이러한 보통의 키워드부터 특정 사건의 키워드에 이르기까지 콘텐츠의 내용과 관련도가 떨어지는 키워드들을 모두 포함시켜 콘텐츠를 생산하는 경우도 어뷰징에 속할 확률이 높습니다.
| 랭킹 알고리즘은 어떻게 개선되나요?
네이버는 여러 경우의 어뷰징 시도들을 분석, 학습하고, 이 결과를 콘텐츠 생산자의 신뢰도에 새로운 피쳐로 추가하여 랭킹 알고리즘에 반영할 예정입니다.
구체적으로, 콘텐츠 생산자가 어뷰징을 시도하고 있는지, 어뷰징의 규모나 빈도가 어느 정도 되는지 등을 분석한 후, 새로운 피쳐를 생산자의 신뢰도 값에 반영하여 검색 결과에서 순위를 결정하는 데 사용하게 됩니다.
단, 이렇게 추가된 피쳐는 최근 n일간의 데이터를 바탕으로 매일 업데이트되기 때문에, 어뷰징 시도를 중단한 생산자들의 신뢰도는 시간이 지남에 따라 어뷰징 시도 이전 수준으로 회복될 수 있습니다.
네이버는 검색 사업자로서 정보의 유용성, 신뢰성 등을 중요시하며, 이용자들에게 신뢰할 수 있는 콘텐츠를 제공하기 위해 검색 알고리즘에 대한 연구를 지속적으로 이어나갈 예정입니다.
관련기사 : 아주경제 – 네이버, 언론사 신뢰도 평가해 검색 우선순위 판단…“어뷰징 원천 차단”
어뷰징 빈도 등 평가 알고리즘에 추가…신뢰도 낮은 언론사는 검색 우선순위서 밀려
2015년 뉴스제휴평가위원회 출범 이후에도 어뷰징 문제 이어지자 원천 차단키로
네이버가 언론사의 ‘뉴스 어뷰징(Abusing:클릭 수를 높이기 위해 비슷한 글을 반복적으로 베껴서 올리는 행위)’ 문제를 해소하기 위해 뉴스 검색 영역에 신뢰도 평가를 적용한다. 뉴스제휴평가위원회 출범 이후에도 언론사의 뉴스 어뷰징 문제가 불거지자 어뷰징이 많은 언론사를 검색 우선순위에서 배제하겠다는 방침이다.
네이버 관계자는 10일 “지난 7일부터 뉴스 검색 영역에서 언론사 신뢰도 평가를 적용하고 운영에 들어갔다”면서 “각 언론사의 뉴스 어뷰징 규모나 빈도 등을 분석해 신뢰도 값에 반영하고 신뢰도가 낮은 언론사는 검색 우선순위에서 밀리게 되는 방식”이라고 말했다.
이 관계자는 “기존 검색 순위를 결정하는 알고리즘에 어뷰징 관련 요소와 대상인 언론사를 새로 추가한 것으로, 사람이 직접 평가하는 것은 아니다”라고 언급했다.
네이버는 △실시간검색(실검) 등 이슈와 관계없는 내용을 담은 뉴스를 생산하는 경우 △관련도가 떨어지는 키워드를 의도적으로 넣어 뉴스를 작성한 경우 △다른 언론사와 유사한 내용의 뉴스를 뒤늦게 생산하는 경우 등을 어뷰징으로 판단하고 신뢰도 평가에 반영하기로 했다.
예를 들어 A언론사가 잦은 어뷰징으로 신뢰도가 내려가게 되면, 네이버 검색 시 해당 언론사의 모든 뉴스가 최신순·관련도순 정렬 우선순위에서 배제돼 검색 결과 뒤쪽으로 밀려나게 된다는 것이 네이버의 설명이다. 네이버는 한번 내려간 신뢰도는 일정 기간 어뷰징 시도를 중단하면 다시 회복되도록 했다.
네이버가 언론사 신뢰도를 평가해 검색 결과에 반영하는 것은 이번이 처음이다. 업계에서는 2015년 뉴스제휴평가위원회 출범 이후에도 언론사의 뉴스 어뷰징 문제가 이어지자 네이버가 뉴스 어뷰징을 원천 차단할 수 있는 방안을 고심해 내놓은 것으로 보고 있다.
네이버는 언론사뿐만 아니라, 최근 어뷰징 문제가 대두된 블로그와 카페, 포스트, 지식IN 등 사용자 제작 콘텐츠(UGC)에도 이 같은 방식을 적용하기로 했다.
다만, 네이버는 구체적인 평가 기준과 시점, 알고리즘 등을 공개할 경우 언론사와 블로거 등이 악용할 수 있다고 보고 이를 공개하지 않았다.
네이버 관계자는 “뉴스제휴평가위원회와는 별도의 평가를 통해 언론사의 뉴스 어뷰징 등 시도를 사전에 방지하고 이용자로부터 검색 신뢰도를 높이겠다는 방침”이라며 “어뷰징 규모와 빈도 외에도 검색 순위를 결정하는 요소는 다양하지만, 현재로서는 어뷰징을 가장 중요한 평가 요소로 보고 있다. 향후 평가 요소를 지속적으로 추가할 계획”이라고 말했다.
출처
- http://searchblog.naver.com/221105431207
- http://www.ajunews.com/view/20180608081842896