PageRank如何产生的

发布时间:2016-01-04

PageRank如何产生的 

网页搜索的本质是网页信息的聚合,把本来很难聚合在一起的网页通过共同包含的关键词聚合起来。网页被聚合后就自然会产生排序问题。归纳起来就是既不能不排,也不能乱排,需要通过科学有效的方法将“好”的搜索结果按照“好”的程度依次排列。当然“好”是一个相当主观的且难以量化的概念,因此如何评价这个“好”成为搜索质量的关键。在搜索引擎的发展史中,Google发明的PageRank无疑是浓墨重彩的一笔。

    Google公司的两位创始人L.Page及S.Brin在1998年提出了PageRank的概念[Page,et al.,1998]。在他们提出这个概念时,
    一方面,万维网的发展正处于信息大爆炸的时期。当时估计大约有1亿5千万网页,而且不到一年的时间网页的数目就会翻倍;
    另一方面,网页质量参差不齐,例如文献[Page. et a1.,1998]中提到的网页信息“从Joe在哪里吃午饭到信息检索的期刊”无所不包,可以说实际有意义的、有价值的,以及经常被用户检索的网页规模并没有想像中的那么大,一个基本的方法是通过为网页排名使得重要性高且有价值的网页能够被优先检索。PageRank(网页排名)就是在这样的应用背景下诞生的。