网页上出现过期的时间可能导致页面不被抓取

发布时间:2016-01-04

网页上出现过期的时间可能导致页面不被抓取

页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?

spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧。建议增加页面内容产生时间,去掉没有必要的时间信息。

总结:
1.网页上切忌勿乱加时间,如我们网站的(始于2014年9月9日)这种时间是一个大忌
2.网页内容尽可能加上产出时间,也就是发布时间
3.百度site的结果时间和权重并无太多关系
4.跟百度沟通的时候,一定要条例清晰,证据确凿。自身的问题一定要先排查准确。