PageRank---Bringing Order to the Web

PageRank通过衡量网页间的链接关系,确定网页的重要性,从而为搜索引擎提供网页排序的依据。算法假设被多个网站链接的网页更优质。其计算过程涉及网页集合、链接关系和归一化因子,通过迭代计算直至rank值收敛。尽管存在如平滑处理和跳出率等改进问题,PageRank在小规模数据上表现良好,并可借助分布式计算处理大规模数据。
摘要由CSDN通过智能技术生成

PageRank

-----------------Bringing Order to the Web 

motivation——为什么有这个算法

一个搜索引擎收录了全球的网页信息,可是这么多的网页,到底哪个网页才是优质的网站呢?作为一个查找信息的用户,肯定希望搜索得出的结果是有充实内容的而不是充斥着大量广告的页面。那么,如何在成万上亿的网页中给他们做个重要性排序呢?PageRank很好地解决了这个问题。


main ——kernel

整套PageRank算法基于以下一个假设:

大量网站所链接到的网站必然是一个更优秀的网站。

这个假设是很符合我们日常生活的,就拿CSDN的优秀博客来说,博主写的文章很优秀,很多人看,很多人关注,然后很多人都来学习,转载他的文章到自己的blog上,因此产生了很多链接指向博主的首页。从这个来说,对于被很多网站指向的网站,我们有足够的理由说明这个网站更为优秀。

how to do it——definition

F(u):网页u所指向的网页集合

B(u):链接到该网页的网页集合

c:归一化因子

num(u):F(u)的size

R(u):衡量网页u的rank值指标


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值