机器学习手记[7-1]--PageRank算法

PageRank是搜索引擎中的一个重要算法,用于网页排名。它通过资源(名声和信用)的流动配置,模拟网络中信息的传递。在这个过程中,假设资源总量固定,网络是连通的,最终达到稳定状态。PageRank通过不断迭代更新资源矩阵,直至资源分布趋于稳定,然后根据资源量对网页进行排名。处理Rank Sink和Dangling Link问题时,会将这些节点的资源分散到其他网页,保持网络的连通性。PageRank计算可以通过迭代误差或寻找矩阵K的主特征向量来实现。
摘要由CSDN通过智能技术生成

pagerank其实是搜索引擎的一个步骤,
搜索引擎要做起来,
1 需要网页数据集作为数据源
2 需要比较合适的数据结构方便检索存储
3 需要一个比较合适的算法将检索到的数据集进行排序展现给大众。


pagerank其实就是第三件事情,
实质上是一个资源的流动配置的方法

所谓的“资源”在这里可以理解为名声和信用,牛逼的网站只引用更加牛逼的网站,这是对所引用网站的一种认可的表现
我们假定名声资源是一定的
1) 资源矩阵V:为各个网页的初始化的名声资源,总和一定。其实就是PageRank的结果(V缩写取自Value)
2) 分配矩阵M:有一个资源配置的矩阵M负责资源的具体分配(M缩写取自Manage管理)
3) 有了上面两项,我们开始利用M矩阵,不断的进行V=MV操作,对名声资源矩阵进行迭代更新计运算。
V=initial_val
while((MV-V)<level):
V=MV

通过V'=MV 不断进行V的流动配置,V不断的更新,直到V名声资源差不多稳定的时候就说可以了
既然大家对资源的争名夺利倒腾的差不多了,诸侯都默认了各自的统治权了,V就基本不变了,那么就开始分封rank吧。
然后大家就按照名声资源稳定的程度进行排序,这个顺序就是Google输出的顺序了


需要再次强调PageRank的几个根本上的假定
假定1 假定资源是一定的,这样分配才有意义,不然就不叫分配了,大家可以自产自销
假定2 假定

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值