1.网站内容质量
1.1飓风算法2.0
百度搜索于2017年7月4日发布飓风算法,严厉打击恶劣采集问题,并在2018年9月13日公布飓风算法升级为2.0版本。
飓风算法2.0主要打击以下四类恶劣采集行为:
-
1.存在大量从其他站点或公众号等内容生产方采集、搬运而来的内容,信息未经整合,排版混乱,文章可读性差,有明显采集痕迹,对用户无任何增益价值。
-
2.存在多段文章拼接的内容,文章逻辑性差,无法满足用户需求,阅读体验差。
-
3.站点内存在大量采集内容,网站自身的内容生产力极差。
-
4.站点内存在大量与本站主题无关的采集内容,领域专注度差,恶意获取流量。例如:科技网站采集大量娱乐八卦、社会新闻等情况。
1.2 飓风算法3.0
百度搜索在2019年8月对飓风算法进行升级,上线飓风算法3.0。
这次算法升级主要针对跨领域采集以及站群问题,将覆盖百度搜索下的PC站点、H5站点、智能小程序等内容。对于算法覆盖的站点/智能小程序,将会根据违规问题的恶劣程度,酌情限制搜索结果的展现。
以下详细说明飓风算法3.0的相关规则。
一. 跨领域采集:
指站点/智能小程序为了获取更多流量,发布不属于站点/智能小程序领域范围的内容,通常这些内容采集自互联网,内容质量及相关性低、对搜索用户价值低。对于这样的行为搜索会判定该站点/智能小程序的领域专注度不足,会有不同程度的限制展现。
跨领域采集主要包括下面两类问题:
第一类:主站或主页的内容/标题/关键词/摘要等信息显示该站有明确的领域或行业,但发布内容与该领域不相关,或相关性较低。
第二类:站点/智能小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊、领域专注度低。
二. 站群问题:
指批量构造多个站点/智能小程序,获取搜索流量的行为。站群中的站点/智能小程序大多质量低、资源稀缺性低、内容相似度高、甚至复用相同模板,难以满足搜索用户的需求。
1.3 细雨算法——针对B2B领域的受益行为
2018年6月,百度搜索发布细雨算法,针对B2B行业的网站受益问题进行规范和引导。
细雨算法主要针对以下问题:
1.页面标题作弊及误导,主要有下面四类:
(1)非公司官网,title中包含“官网”等字样,误导搜索用户认为是官网
(2)页面title中堆砌相近关键词;
(3)页面title中穿插火星文字或者特殊符号,影响正常阅读;
(4) 页面title中穿插受益方式。
2.页面正文内容中存在受益信息,主要包括以下三类问题:
(1)正文内容不完整,频繁穿插变形的受益方式。
具体是指:正文内容为无价值内容的拼接或者正文内容不完整,同时采用“英文字母”、“汉字谐音”、“特殊符合”、“全角符合”等方式代替联系方式,穿插在正文内容中。
举例:5992八⑧⑧⑧
举例:13800138000
(2)文章的配图图片中存在受益联系方式。
具体是指:图片中联系方式水印面积较大,严重损害浏览体验。
(3)正文中商品或者服务信息内容为乱采集、拼接而成、排版混乱、用户从页面中无法获得商品或者服务信息。
1.4 细雨算法2.0——针对B2B领域违规低质内容
2019年11月,百度搜索发布细雨算法2.0,针对B2B