PageRank算法改进

PageRank算法在文献排名中应用,基于文献引用网络进行价值评估。NTMP算法通过时间因子影响函数和并行化处理优化迭代过程,考虑文献影响力的衰减,提升了评价的准确性和效率。在分布式集群中,MapReduce用于实现NTMP值的计算和文献排名。
摘要由CSDN通过智能技术生成

PageRank算法的应用

PageRank 算法是 Google 搜索引擎进行网页排名的一种算法,那么它如何映射到其他领域?

比如,我们如何在文献排名中应用PageRank算法呢?

对文献的质量进行排序是对文献价值进行评估的一种重要手段,目的是为了方便人员在检索时查阅。

统计文献的被引次数是一种非常直观的统计方式,在此基础之上,我们引入了 PageRank算法:该算法基于网页之间的链接关系评估网页的价值,由于互联网与文献引用网络之间存在着较大的相似性,所以基于文献之间的引用网络使用 PageRank 算法可以更合理的对于文献的价值评估。

该算法基于一种投票关系:A 文对 B 文进行了引用是因为 A 文认为 B 文质量较高,即通过引用的方式给B文投票,之后再通过投票关系对文献进行排名。

根据PageRank的原理,在文献排名的过程中,PageRank 算法同样遵循以下两个基本假设:

  1. 数量假设。如果一篇文献 A 被其他文献引用,说明其他文献认为文献 A 比较重要,也就是其他文献将自己的 PageRank 值贡献给 A。表明 A 是一篇有质量的文献,所以文献 A 的 PageRank 值会比较高。
  2. 质量假设。如果一篇高 PageRank 值的文献引用了一篇其他的文献,则被引用的文献的 PageRank 值也因此而提高。

算法的公式形式不变,如下所示,但是其中各个量的含义会发生变化。

其中 p 代表某个待评价的学术文献, d 是阻尼系数。 CTotal 是文献总量。 N 表示 N </
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值