百度飓风算法4.0

如果一个网站的文章都来源于采集,那么内容质量会参差不齐,特别是跨领域采集,影响了整个搜索生态。长此以往,会导致互联网资源整体质量大幅下降,因此百度搜索针对恶劣采集内容的来源网站,推出了飓风算法。

百度飓风算法

一、飓风算法是什么

为了营造良好的搜索内容生态,**搜索用户的浏览体验,百度发布了飓风算法,旨在严厉打击恶劣采集行为和站群问题,将覆盖百度搜索下的PC站点、H5站点、智能小程序等内容。对于算法覆盖的站点/智能小程序,将会根据违规问题的恶劣程度,酌情限制搜索结果的展现。对于第一次违规的站点,改好后接触限制展现的周期为一个月;对于第二次违规的站点,百度将不予释放搜索展现。

二、飓风算法的版本

1) 飓风算法1.0

2017年7月4日,百度推出飓风算法,旨在严厉打击以恶劣采集为内容主要来源的网站,同时百度搜索将从索引库中彻底清除恶劣采集链接,给优质原创内容提供更多展示机会,促进搜索生态良性发展。

2) 飓风算法2.0

2018年9月13日,百度对飓风算法进行升级,发布飓风算法2.0,主要打击采集痕迹明显、内容拼接、站点存在大量采集内容、跨领域采集等五类采集行为。飓风算法2.0旨在保障搜索用户的浏览体验,**搜索生态的健康发展、对于违规网站,百度搜索会依据问题的恶劣程度有相应的限制搜索展现的处理。

3) 飓风算法3.0

2019年8月8日,百度搜索将飓风算法升级到飓风算法3.0,主要打击百度搜索下的PC站点、H5站点、智能小程序存在的跨领域采集及批量构造站群获取搜索流量的行为。飓风算法3.0旨在维护健康的移动生态,保障用户体验,保证优质站点/智能小程序能够获得合理的流量分发。

二、飓风算法主要针对的问题

1、跨领域采集

第一类:主站或主页的内容/标题/关键词/摘要等信息显示该站有明确的领域或行业,但发布内容与该领域不相关,或相关性较低,比如美食类智能小程序发布足球相关内容。

第二类:站点/小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊、领域专注度低。

2、站群问题

指批量构造多个站点/小程序,获取搜索流量的行为。站群的内容大多质量低、资源稀缺性低、内容相似度高、甚至复用相同模板,难以满足搜索用户的需求。

3、采集痕迹明显

网站存在大量从其他站点或公众号采集、搬运而来的内容,信息未经整合,排版混乱,部分功能缺失或文章可读性差,有明显采集痕迹,用户阅读感受很差。比如文章内容中存在超链接不可点、功能缺失问题。

4、内容拼接

采集多篇不同文章进行拼接,内容未形成完整逻辑,存在阅读不通顺、文章不连贯等问题,无法满足用户需求。

5、站点存在大量采集内容

网站内容下多数内容均为采集,网站自身无内容生产力或内容生产能力较差,网站内容质量较低。

三、如何应对百度飓风算法

1、采集的内容不能原搬照旧,需要自己再进行整合归纳,排版好、文章要有增益,比如采集的原文章没有配图,但采集过来后加上了配图;原来没有视频,如果用户有视频的需求,那就添加一个视频,这就是增益。

2、文章逻辑性要强,不能断章取义、到处截取、随意拼接,这样的文章显然是不合格的,所以采集过来的文章要进行重新组合,要有一定的逻辑性,关键能解决用户需求,不影响用户的阅读体验。

3、网站不能一直进行内容采集,要采集和原创、伪原创相结合,否则搜索引擎会判定你没有内容生产能力。

4、网站内容要与网站的定位和网站的主题密切相关,不能驴头不对马嘴,做服装的网站里出现数码电子的内容,这明显是等着搜索引擎的惩罚。

简单总结:百度一直在鼓励站点生产领域内的文章和内容,通过领域专注度获得更多的搜索流量。所以不要尝试大量采集内容来获得短期收益,对于网站发布的内容,要注意文章的排版和布局,不应出现与文章主旨不相关的信息或不可用的功能,干扰用户的浏览。如果有转载文章需标明出处,比如新闻、政策类等标明出处的转载内容,不会被认为是采集内容。如果一个网站的文章全部来自**,内容质量会参差不齐,尤其是跨域**,影响整个搜索生态。长此以往,互联网资源的整体质量会大打折扣。因此,百度搜索针对收集不良内容的来源网站推出了飓风算法。



]1。什么是飓风算法

为了营造良好的搜索内容生态,**搜索用户的浏览体验,百度发布了飓风算法,旨在严厉打击不良收录行为和站。对于算法覆盖的站点/智能小程序,搜索结果的显示将根据违规的严重程度进行适当限制。对于首次违规的站点,修改后的联系限制展示期为一个月;对于第二个非法站点,百度不会发布搜索显示。

二。飓风算法版本
1)飓风算法1.0

2017年7月4日,百度推出飓风算法,旨在严厉打击不良数据采集。

2)飓风算法2.0

2018年9月13日,百度升级飓风算法,发布飓风算法2.0,主要打击收藏痕迹明显、内容拼接、站点大量收藏内容、跨域收藏等五种收藏行为。飓风2.0旨在保障搜索用户的浏览体验,**搜索生态的健康发展。对于非法网站,百度搜索会根据问题的严重程度限制搜索显示的处理。

3)飓风算法3.0

2019年8月8日,百度搜索将飓风算法升级为飓风算法3.0,主要打击百度搜索旗下PC站点、H5站点、智能小程序的跨域收录,以及批量建设站群获取搜索流量。飓风3.0旨在维护一个健康的移动生态系统,保障用户体验,确保优质站点/智能小程序能够获得合理的流量分配。

二。飓风算法的主要问题
1。跨域收藏

第一类:主站或首页的内容/标题/关键词/摘要等信息说明了这一点。

第二类:站点/小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊,领域关注度低。2 .
。站点群问题

是指批量构建多个站点/小程序以获取搜索流量的行为。群体内容大多质量不高,资源稀缺性低,内容相似度高,甚至重用同一个模板,难以满足搜索用户的需求。
[br/]3。收藏痕迹明显

网站有很多内容是从其他站点或者微信官方账号收集和输送过来的。信息不整合,版面混乱,部分功能缺失或文章可读性差,有明显收藏痕迹,用户阅读感差。比如文章内容存在一些问题,比如缺少超链接,功能不够。

4。内容拼接

收集了若干篇不同的文章进行拼接,但内容没有形成完整的逻辑,存在一些阅读性差、文章不连贯等问题,无法满足用户的需求。5 .
。站点上收集的内容很多

网站下大部分内容都是收集的,网站本身没有内容生产力或者内容生产力差,网站内容质量低。

三。如何应对百度飓风算法[/S2/]
1。收集的内容不能原样移动,需要自己整合总结。布局不错,文章应该有收获。比如收藏的原文章没有图片,收藏后加了一张图片;原来没有视频。如果用户有视频需求,那就加一个视频,这就是增益。2 .
。文章要有逻辑,不能断章取义,到处截取,随意拼接。这样的文章显然是不合格的,所以收集的文章要重新组合,要有一定的逻辑性。关键是在不影响用户阅读体验的前提下解决用户需求。
[br/]3。网站不可能一直收集内容。要结合原创和伪原创,否则搜索引擎会判定你没有内容生产能力。

4。网站的内容要与网站的定位和网站的主题紧密相关。马嘴不会错的。做衣服的网站出现数字电子内容,显然是等待搜索引擎的惩罚。

简单总结:百度一直鼓励站点在域内生产文章和内容,通过域聚焦获得更多的搜索流量。所以不要试图收集大量内容来获取短期利益。对于网站发布的内容,注意文章的布局和版面。不应有与文章主旨无关的信息或干扰用户浏览的不可用功能。如有需要注明出处的转载文章,如新闻、政策等注明出处的转载内容,不视为采集内容。

标签:百度搜索算法