PageRank
-----------------Bringing Order to the Web
motivation——为什么有这个算法
一个搜索引擎收录了全球的网页信息,可是这么多的网页,到底哪个网页才是优质的网站呢?作为一个查找信息的用户,肯定希望搜索得出的结果是有充实内容的而不是充斥着大量广告的页面。那么,如何在成万上亿的网页中给他们做个重要性排序呢?PageRank很好地解决了这个问题。
main ——kernel
整套PageRank算法基于以下一个假设:
大量网站所链接到的网站必然是一个更优秀的网站。
这个假设是很符合我们日常生活的,就拿CSDN的优秀博客来说,博主写的文章很优秀,很多人看,很多人关注,然后很多人都来学习,转载他的文章到自己的blog上,因此产生了很多链接指向博主的首页。从这个来说,对于被很多网站指向的网站,我们有足够的理由说明这个网站更为优秀。
how to do it——definition
F(u):网页u所指向的网页集合
B(u):链接到该网页的网页集合
c:归一化因子
num(u):F(u)的size
R(u):衡量网页u的rank值指标