네이버가 뉴스 검색 서비스 품질을 높이기 위해 이슈 검색어를 노린 어뷰징(abusing) 기사와 뒤로 가기 강제 광고 노출 기사를 검색 결과에서 불이익을 주기로 했다.

네이버는 지난해 5월 전문가 11인으로 구성된 ‘네이버 뉴스 알고리즘 검토 위원회가 발족한 후 뉴스 검색을 포함한 뉴스 서비스 알고리즘에 대한 전반적인 검토를 진행한 결과, 오는 14일부터 뉴스 검색 랭킹 알고리즘을 변경할 예정이라고 밝혔다.

이번에 네이버가 설명한 뉴스 검색 랭킹 알고리즘 변화에 따르면 특히 검색 서비스 품질 저해 요소로 작용하는 어뷰징 기사와 기사 클릭 후 사용자가 뒤로 가기 버튼을 눌러도 네이버 페이지로 돌아오지 않고, 광고가 노출되는 경우 검색 결과 상위에 랭크되지 않도록 할 방침이다.

네이버는 “네이버 뉴스 검색을 통해 뉴스를 소비하는 양이 막대하기 때문에 오로지 그 클릭을 얻기 위한 목적으로 생성되는 어뷰징 기사가 대량 유입되고 있다”며 “이 어뷰징 기사의 유입은 검색 품질을 하락시키는 것뿐만 아니라 기사의 대상이 되는 개인의 명예를 훼손하기도 하는 심각한 문제 행위”라고 지적했다.

이어 “네이버 뉴스 검색 알고리즘에서는 이런 이슈 검색어를 노린 어뷰징 문서의 생산 추이를 감지하고 검색에 반영하고 있다”며 “또한 사용자의 사용 환경을 불편하게 만드는 외부적인 요인(뒤로 가기 강제 광고 노출)도 검색에 반영할 예정”이라고 밝혔다. 하지만 이런 저해 요소가 사라진다면 검색 순위는 다시 개선될 수 있다.

▲ 경기 성남시 분당구에 위치한 네이버 그린팩토리 사옥. ⓒ 연합뉴스
▲ 경기 성남시 분당구에 위치한 네이버 그린팩토리 사옥. ⓒ 연합뉴스
네이버는 또 네이버 뉴스 검색 알고리즘에 △연관성 △시의성 △기사의 품질을 점수화해 검색 랭킹을 결정할 계획이다.

​‘연관성’은 기사와 사용자의 질의가 관련된 정도를 의미하며, ‘시의성’은 기사가 포함하고 있는 정보가 현재 시점에서 얼마나 유효한 정보인가를 뜻한다. 네이버는 시의성과 관련해 “해당 기사의 작성 후 경과 시간과 기사에서 다루고 있는 정보가 어느 시점에 네이버 뉴스 검색 안에 포함됐는가를 측정해 점수화한다”고 설명했다.

아울러 네이버는 기사의 품질에 대해서도 △충실성 △참신성 △독창성 △선정성 등 품질 요소를 기반으로 기계적으로 추출된 품질 지수를 개발해 검색에 적용하고 있다고 했다.

기사의 ‘충실성’은 기사가 사건에 대해 중요한 정보를 빠짐없이 담고 있는지, 그 정보를 뒷받침할 데이터는 충분하게 포함하고 있는지, 그리고 그것이 사용자에게 잘 전달될 수 있는 형태로 구성돼 있는지 등을 평가하게 된다.

기사가 담고 있는 정보가 사건에 대해 얼마나 새로운 관점을 제시하는지, 기사가 담고 있는 내용이 사안에 대한 이해를 높일 수 있는지는 ​‘참신성’ 품질 요소에 해당한다.

‘독창성’ 요소에선 해당 기사에서 담고 있는 내용이 다른 언론사와 비교해 빠르게 기사화된 것인지, 기사가 해당 언론사의 취재에 기반해 작성된 것인지 등의 정보를 측정한다.

반면 ​사람들의 이목을 끌기 위한 목적으로 자극적인 제목을 달거나 필요 이상의 선정적인 내용을 담고 있는 기사는 저널리즘 관점에서 뉴스 검색의 품질을 저해하는 ‘선정성’ 요소로 판단해 검색 순위에서 밀려나도록 알고리즘을 바꾼다.

다만 국내 뉴스 검색 시장에서 압도적인 점유율을 차지하는 네이버의 이 같은 뉴스 검색 서비스 정책 변화에도 랭킹 알고리즘의 허점을 이용한 어뷰징 기사와 속보·가십성 ‘단독’ 기사 남발은 계속될 것으로 보인다.

네이버는 “검색 랭킹 알고리즘과 어뷰징에 대한 시도는 창과 방패의 싸움과 같고, 어떤 검색 랭킹 알고리즘도 완벽할 수 없는 한계가 있기에 네이버 뉴스 검색도 미흡한 부분이 있을 수 있다”며 “그럼에도 네이버는 보다 신뢰할 수 있는 양질의 기사를 사용자에게 제공할 수 있도록 뉴스 검색 알고리즘에 대한 기술적인 연구를 지속적으로 이어갈 예정”이라고 밝혔다.

앞서 지난해 11월 뉴스 알고리즘 검토위는 검증 결과 발표회에서 기사 독창성 평가에 대한 질문에 “고유한 뉴스를 생산하는 언론사 기사들이 먼저 배열될 수 있도록 할 것인지 여부는 업체의 선택”이라며 “최소한의 방법으로 가리는 것은 큰 문제가 없을 테지만 기술적으로 기사 내용을 구분하는 건 어렵다”고 답했다.

저작권자 © 미디어오늘 무단전재 및 재배포 금지