互联网的快速发展离不开原创和稀缺的优质资源,而通过我们近期的数据分析和用户反馈发现,部分网站采取疯狂而低劣的采集手段,短时间内拼凑出大量低质量采集网页。这种行为使得互联网上内容拼接、偷换标题、过多垃圾广告等低质量的网页逐渐泛滥,不仅严重影响了正常用户的浏览体验,同时也导致优质原创内容无法优先展现,对用心构建原创和精品内容的网站也造成了一定的伤害。
360搜索一直以来,以鼓励互联网原创生态为宗旨,秉承“保护原创+控制采集”的原则。针对这一典型采集泛滥的现象,基于业界领先的安全大数据和大规模机器学习平台,研 发和上线了“后羿算法”:对低劣的采集站点加以控制,对原创和稀缺性网页进行保护和提权,同时确保新闻网站之间正常的转载行为不受影响。
“后羿算法”上线后,对于内容丰富的优质网页(如原创、稀缺资源、精心编辑的内容页等),会增加其在用户面前展现的机会;对于滥用采集手段的行为(如整站大规模采集,页面内容拼凑、含有大量广告干扰用户阅读、恶劣弹窗跳转、大量堆砌无关热词、站内搜索结果页等),会显著降低其展现机会和网页收录量。
我们建议网站存在上述问题的站长,能够从长远发展考虑,积极完善网站建设,提供更多时效性高、内容丰富的原创内容,引擎将随着网站完善,不断提升收录量。同时也欢迎原创网页的作者,通过360站长平台主动提报我们收录缺失的信息。
360搜索将矢志不移地与无数专心做好站的站长共同建设良好的互联网生态环境,感谢一直支持我们的站长及用户!
如果对网站采集判定结果及收录状况存在异议,站长可以通过站长平台的反馈中心及360搜索论坛版主进行反馈:
站长平台反馈中心:http://info.so.com/feedback.html?product=zhanzhang