百度飓风算法2.0的推出,网站还能采集吗?

2018年9月13日,百度发公告称将推出飓风算法2.0,指在严厉打击恶劣采集行为的站点。那飓风算法2.0一出,网站还能进行对文章的采集吗?

网站采集文章,实际上是一直以来很多站点内容获取的一种方式。虽然这种方式很受人鄙视,剽窃别人的原创作品,从而应用于自己的网站上,我也是一种遭遇着这种行为。但确实没有办法,相关站点那么多,谁也不能管控这些问题。但百度飓风算法推出之后,很多采集者遭受了严厉的打击,有的流量每天百万级的现在也只有几万uv的不在少数。

那现在文章还能通过采集发布吗?

首先,文章采集这件事本身是没有问题的,但道德上考虑加上人家原创作者的归属就可以。严格来说百度并不是打击采集行为,而是针对性的打击恶劣采集行为。

什么是恶劣采集行为呢?

这里赵彦刚举例说明一下,知名网站A通过对很多网站的内容采集,在百度上获得了很多的流量。它内容采集的方式是利用工具进行采集,在采集的过程中,去掉对方的品牌、链接以及一些图片水印的同时,把段落代码也去掉了。发布到自己网站后,变成了一大段文字,段落不清晰,甚至还有大量的空格不知道是啥目的。而且整个网页而言很多内容都和当前网页不想关。在飓风算法2.0出来后,它无疑被惩罚了。

所以你单纯为了内容而采集,完全不顾用户浏览内容的体验。就被称之为恶劣的采集行为。是不可以的。

怎么采集文章,才不会被飓风算法2.0惩罚呢?

要不想命中飓风算法,我这里给出以下几点建议:

  • 良好的阅读体验:段落清晰、阅读通顺、甚至整改原创文章的一些错别字等,让内容本身是你读起来至少感觉到是人写的;
  • 优秀的内容排版:内容的排版好与坏搜索引擎是能够识别的,所以字号多大、段落间距、文字间距、字体颜色、图片插入位置及大小等,有没有比原创文章站点的更美观,更能让人轻松浏览。
  • 相关的其他元素:除了你内容主题的采集部分外,你网页的最新推荐、相关推荐、热门文章、编辑推荐等是不是都与当前文章主题相关呢?为用户提供更多与当前网页相关的内容进行延展阅读,也是提高当前网页质量的关键。

可想而知,如果你采集过来的内容无论从阅读体验、内容排版还是其他元素的相关性上,都更比原创站点好。有什么理由说你是恶劣的采集站点呢?

所以采集本身,从百度的角度上来说并不会遭受惩罚,但影响用户的体验就不同了。搜索引擎最为关心的是目标站点能不能很好的、综合性的解决用户的需求。

当然,现在搜索引擎加大对原创文章的保护力度确实对采集站点不利,这是趋势。如果流量都让采集站点抢走了,谁还来创造好的内容呢?

原创文章:《百度飓风算法2.0的推出,网站还能采集吗?》,作者:赵彦刚。不经允许,请勿转载,如若转载,请注明出处:https://zhaoyangang.cn/?p=1857

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
赵彦刚的头像赵彦刚
上一篇 2019 年 2 月 28 日 10:04
下一篇 2019 年 2 月 28 日 11:42

相关推荐

回复 匿名

您的电子邮箱地址不会被公开。 必填项已用 * 标注

评论列表(2条)

  • 匿名的头像
    匿名 2020 年 11 月 9 日 00:01

    完全错误,飓风算法就是打击采集,和用户体验无关,恶劣采集是指大量采集。如果一个网站内容100%采集 ,哪怕排版精美,用户体验好,也能中飓风

    • 赵彦刚的头像
      赵彦刚 2020 年 11 月 9 日 19:59

      @匿名从搜索引擎的本质思考!如果你的网页浏览体验良好,内容清晰可读、段落分明。那么从根本来说是在良好的浏览体验下满足了用户需求。至于是不是采集用户是不关心的,搜索引擎致力于在良好的浏览体验下解决用户需求。所以从排版混乱、段落不分明、阅读体验差,对比大量采集、页面浏览体验好、段落清晰、满足用户需求这两者之间,你觉得哪个是搜索引擎更应该重视的呢?
      而且个人操作的多个站点也存在大量采集的行为。且一直在搜索引擎端表现不错。