본문 바로가기
블로그 운영

네이버 웹커넥트데이 새 검색개선 그리핀 프로젝트 티스토리 블로그 웹문서 중복으로 인해 유사문서 탓에 저품질 블로그로 빠질 위험

by 낯선.공간 2017. 12. 11.

목차

    음 본인 글들 유사문서 빠진거 체크들 하고 계신가요?

    이번에 네이버 웹커넥트데이에서 발표된 그리핀 프로젝트를 통한 검색 고도화 개선의 일환으로 웹사이트 통합하면서 네이버의 뻘짓 중 하나가... 

    티스토리 블로그글들도 웹문서로 중복되어서 크롤링 되어 있는데요. 

    보통은 블로그 문서가 원본글인데 웹문서로 수집된 글이 이상하게 원본으로 인식되어서 블로그 글이 누락되는 경우가 종종 있어요. 

    넋놓고 내비두면 저품질 블로그 되고 있습니다.

    미리미리 찾아서 원본반영 신청 하시면 방지 하실 수 있어요.

    그리고 누락문서 찾는 한가지 팁을 드리면... 

    전에 누락문서 찾는 사이트는 rss기준 50개문서까지만 체크해주거든요.

    네이버에서 출처에 블로그 주소 넣으시고 검색어로 "이" 를 검색합니다.

    유사문서 포함과 미포함으로 구분해서 검색결과 갯수를 비교해 봅니다.

    누락된 문서 수를 찾고 최신순으로 비교해서 찾아내면 상당히 과거의 누락 문서도 찾긴 합니다.

    이렇게 찾아낸 문서들은 원본반영을 요청합니다.

    혹은 불필요한 문서들은 웹수집검색제외 요청을 통해서 누락문서에서 빼버려야 저품질블로그가 되는 것을 막을 수 있습니다.

    참고 글 : 

    네이버, ‘2017 웹커넥트 데이’ 개최...웹 검색 개선 http://www.dailian.co.kr/news/view/679302/?sc=naver

    네이버가 가두리를 포기한다? http://outstanding.kr/naverweb20171208/

    반응형