“404”表示该页面找不到

 百度处理     |      2021-10-27 16:09

  链,所以搜索引擎就有机会把它收录进去。

  图6-22 细分归类的标签

  无论是动态地址还是静态地址,做内链或外链时,指向同一个页面的网址只能是唯一的,这样才是URL的标准化。搜索引擎收录了这个网址,才能集中力量提升权重。

  6.10 什么是死链接和错误链接

  错误链接就是根本不存在的链接,如图6-23所示。

  图6-23 错误链接

  死链接是原来访问正常,后来因为网站的变故而不能访问的链接。比如,以前发布了一篇文章,它对应一个网址,后来我在网站的后台把这篇文章删除了,那么你再输入这个网址时,就会显示与图6-23一样的界面,表示找不到该网页。

  死链接与错误链接的区别是:错误链接是本来就不存在的,而死链接是本来存在,后来由于某种原因被删除掉的。

  关于错误链接,只要知道概念即可。这里主要介绍死链接,比如,你今天发布了十篇文章,当时觉得不满意又把它们删除了,一般来讲不会有太大影响。但问题是,文章被搜索引擎收录了,某人在百度搜索关键词时,点击到这种被收录而又不存在的文章,会显示“无法找到该页面”,这就是死链接。

  死链接会造成什么影响呢?如果搜索引擎已经收录了你的文章,但后来这篇文章被删除了,而搜索引擎下次会根据上一次的记录访问该文章,结果发现该网页以前能打开但现在打不开了。这样的死链接,有少许影响不大,但如果太多就会导致搜索引擎对你的网站印象不好。

  什么情况下会出现很多死链接呢?比如,我的博客有很多页面已经被百度收录了,某天我突然把博客里的内容全部清空,改版成另外的网站,这就会出现很多死链接,即很多网页都打不开了。这些原本能打开的页面突然都打不开了,百度就会对你的网站印象不好。如果你的网站要改版,可以适当地利用robots文件把搜索引擎屏蔽掉,等搜索引擎把你要删除的网页从数据库里剔除后,就没有关系了。

  提示:关于robots文件,以后会介绍。

  6.11 网民必须认识的404错误页面

  本节向读者介绍什么是404页面以及怎么做自定义404页面。任意打开一个不存在的网址,会显示“无法找到该页”,如图6-24所示,这就是系统默认的404页面,告诉访问者这个页面不存在。在淘宝网址“www.taobao.com”后面随意加一些字母,打开一个并不存在的网页,如图6-25所示。或在新浪网址“www.sina.com.cn”后面加入字母,打开一个并不存在的网页,如图6-26所示。以上这些网页都是404页面。

  图6-24 系统默认的404页面

  图6-25 淘宝网的自定义404页面

  图6-26 新浪网的自定义404页面

  图6-25和图6-26这类与系统默认不同的404页面,是中大型网站自己设计的404页面,叫作自定义的404页面。如果不做自定义,当网页不存在时,就会自动跳转到图6-24中这种默认的404页面。

  中大型的网站页面很多、内容庞大,有些页面内容过期或者违规被删除掉了,用户点击这些页面就会出现“该页面不存在”的情况,这种概率很高。像淘宝、新浪这种大型网站一天的访问量庞大,总有人会输入错误地址或已不存在的地址,即错误链接或死链接,就会出现404页面。从用户体验的角度出发,比如,图6-25中淘宝的自定义404页面告诉用户“页面无法访问”,然后给出一些其他网址,这是在引导用户浏览其他页面,以免访客流失。

  小网站是否做404页面不是特别重要,因为小网站访问量不大,也不经常删除文章,所以访客点入该网站,很少点入不存在的页面。但对于中大型网站做自定义的404页面是有必要的。

  怎么做自定义的404页面呢?比如,你很喜欢图百度的自定义404页面,可以模仿它来做。

  首先,打开图百度自定义的404页面,然后查看网页源代码,如图6-27所示,title标签处写着“百度-您的访问出错了”。假如你的网站叫作“好好减肥网”,你可以把该title标签改为“好好减肥网-您的访问出错了”。同理,把源代码中“百度”两个字都改为“好好减肥网”,再把所有百度的超链接改为好好减肥网的超链接,最后单击保存,将保存好的文件名改为404,将其后缀改为“htm”即可。打开改好的文件,如图6-28所示,这就是修改后的自定义404页面。

  图6-27 百度404页面的网页源代码

  做好自定义的404页面后,在自己的网站打开不存在的页面,就会出现自定义404页面。这里再强调一下,对于小型网站,自定义的404页面可做可不做,如果网站内容比较庞大,可以考虑做。404页面对SEO排名不太重要,了解即可。

  图6-28 自定义的404页面

  6.12 了解网站的HTTP状态码

  查询HTTP网页状态码的工具有很多,比如,打开站长工具的“页面HTTP状态查询”,输入月光博客网址“www.williamlong.info”,查询结果如图6-29所示,显示“返回状态码:200”,“200”表示该页面是存在的。

  图6-29 状态码查询

  输入一个不存在的404页面网址,查询结果如图6-30所示,显示“返回状态码:404”,“404”表示该页面找不到。“200”和“404”就叫作网页的状态码。

  图6-30 404页面状态码查询

  关于其他状态码,如301、7788等,这里不再过多解释,你可以用百度搜索“http返回网页状态码查询”,如图6-