死链接正确处理方法及提交协议

发布时间:2015-10-12

很多网站都或多或少可能会出现在死链接,那么什么是死链接呢?在百度眼中的死链其实包括三种:协议死链、内容死链、跳转死链,每种都有所不同。关于死链接的产生你还可以参考以下两个文档:死链接的出现和处理(一) ,死链接的出现和处理(二) 。百度呼吁,尽可能全面地通过百度站长平台死链提交工具提交协议死链、内容死链和跳转死链,网站在百度搜索引擎的可访性和价值得到提升,以获得更高的用户评价。

一.协议死链:
协议死链是指通过HTTP协议状态码明确表示网页已无阅读价值。HTTP协议状态码很多,但百度协议死链首推404,即未找到文件

二.内容死链:
内容死链主要是由网站自身变化引起的,网页可以正常打开未发生跳转,但页面内容对爬虫来说没有收录价值,对用户来说也没有参考价值,如帖子被删除、内容已转移、空间被关闭、信息已过期、交易已关闭等。在这样无有价值信息的网页上,网站应该在明显位置直接给予提示文字,如:
·页面不存在(网页不存在)
·内容已转移
·帖子已删除
·域名过期或出售
·空间被关闭
·网站要备案
·信息已过期
·交易已关闭

现在很多网站追求个性化和用户体验,在页面内容失效后并未做协议死链处理,也就是说返回状态码依然是200,仅仅是在页面上做了一个有趣的个性化图片,通过图片告诉用户这个页面没有有价值内容——但是百度不会认为这是一个内容死链,不提倡大家这样做。

典型范例1:



典型范例3:


三.跳转死链
跳转死链是指网站将无阅读价值的页面统一跳转到某一个页面,如前一级目录面、首页等等,跳转前后的两个网页主体内容不同,不存在可替代的关系。除了404协议死链和内容死链外,站长还需要向百度提交跳转死链