一直以来太多人在设置404页面上都认为再简单不过了,但实际上有太多的公司没有合理、正确的设置404页面。那设置404页面到底都有哪些规则呢?下面赵彦刚和你一起讨论下。
先补充说明一下什么是404页面?在浏览器对网页进行访问时,当网页发生相应错误或不存在时,会提示404状态码,页面会出现“Not Found”错误信息的提示。那提示信息的也是一个页面,既称为404页面。
首先是否需要设置404页面,需要先确定哪一类页面返回的是404状态码,这点我们可以通过chinaz的http状态码查询工具进行查询(查询地址:http://tool.chinaz.com/pagestatus/),如下图:
那对应返回的页面,就是我们需要进行设置的。当我们没有对该页面进行设置的时候,服务器正常返回的页面如下图(之一):
那这不是正常返回404页面了吗?状态码也是404,为啥还要设置呢?怎么设置才算正确的呢?
第一:当用户访问了错误的页面,会返回如上图的404页面,但没有任何返回我们原网站的链接,会导致用户的流失;第二:状态码设置不正确也会导致搜索引擎误认为该页面是可以正常访问的,会导致搜索引擎爬虫抓取到大量的空页面或者重复页面。
如下是几种经常容易出错的例子:
一、不存在的页面返回了200的结果:
如下图,我的检查结果,看图中的这个URL就知道这个URL是不存在的。但查询状态码还是返回200,这样会导致爬虫大量抓取这种页面,并造成太多的无效页面,甚至是垃圾、重复页面。对网站的影响是很大的。
二、跳转的404页面
正常的404页面返回结果是这样的:当你访问了错误页面,URL是不会发生变化的,而网页会直接出现我们设置好的404页面。如下图的流程。
访问正常的URL地址:http://www.hqwx.com/record/?type=lesson&course_id=375。我们把后面的375改成37512312321232131。然后进行访问发现如下结果:
发现我们设置好的404页面确实是出来了,但url发生了跳转。那我们看下这个跳转的url是什么状态码。
返回状态吗不是404,那爬虫岂不是就理解错了!302是个临时跳转状态码。
三、未正确设置404页面的情况
如上图,访问的URL没变,但404页面是这样的。用户看到了 可能会不明白是什么意思,同时,没有返回网站的链接地址。也会导致用户的流失。但爬虫是没问题的。
如上,是设置404页面一些网站经常忽略的问题。希望你知道了这个问题后,对自己网站进行排查。并进行正确的设置。如果对本文中存在问题,请在下方评论区进行评论回复。我们第一时间帮你解答。
原创文章:《404页面设置原来有这么多事儿!》,作者:赵彦刚。不经允许,请勿转载,如若转载,请注明出处:https://zhaoyangang.cn/?p=1253
评论列表(20条)
坚持更新,做好自己
大神!受我一拜!
我踩故我在,下次还会来!
文章不错非常喜欢
SEO真的是摸不清短时间内
找了好久才找到这里,来了就不想走!
新年虽已过,好运不打折!
好快哦,又是新一年啦!
博客是个好东西,让人能学习到很多东西!
鸟儿叫,花儿笑,一年一季春来到!
新春佳节到。祝好!祝好!
我的网站后台打开就是第二张图片的状态,不知道是什么原因 也不知道怎么解决
不错!不错!感觉好极了!
博客还真是个好东西!
转眼又是新一年,博主万事如意不差钱!
初来乍到,无条件支持!
深受启发,无条件支持!
捧个人场……
@跨境电商之家:新手,准备着手这个。。。
@跨境电商之家:新手~学习起来~~~~~