PageRank算法简述

PageRank算法使得Google搜索引擎的搜索结果相比起应用该算法之前有了质的提升。互联网中的网页非常多,那么如何确定网站的可信度是搜索引擎必须要先处理的问题。而PageRank算法则用了一个比较科学的方法处理这个问题:即一个网页被越多其它网页链接,他受到的普遍承认和信赖也就越高。当然,如果单单是这样还是比较不合理的,对于一些本身信赖度就比较高的网页,应该分配给这些网页比较高的权重。


可是这样子又会引出一个问题,要确定某个网页的可信度必须先确定引用了这些网页的可信度。这样循环下去,会让这个问题陷入一个奇怪的循环。而布林把这个问题成功解决了。他结合二维矩阵并加入迭代的思想。一开始假定所有网页的可信度是相同的,即赋予相同的初始值,然后根据这个条件算出各个网页的可信度。然后根据第一次计算得到的结果算出第二次迭代的结果,这样迭代几次之后,计算得到的值就会收敛于真实值。但是,互联网上的网页数量过于巨大,基于这个问题佩奇和布林又使用了稀疏矩阵的技巧大大简化了计算量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值