PageRank算法的应用
PageRank 算法是 Google 搜索引擎进行网页排名的一种算法,那么它如何映射到其他领域?
比如,我们如何在文献排名中应用PageRank算法呢?
对文献的质量进行排序是对文献价值进行评估的一种重要手段,目的是为了方便人员在检索时查阅。
统计文献的被引次数是一种非常直观的统计方式,在此基础之上,我们引入了 PageRank算法:该算法基于网页之间的链接关系评估网页的价值,由于互联网与文献引用网络之间存在着较大的相似性,所以基于文献之间的引用网络使用 PageRank 算法可以更合理的对于文献的价值评估。
该算法基于一种投票关系:A 文对 B 文进行了引用是因为 A 文认为 B 文质量较高,即通过引用的方式给B文投票,之后再通过投票关系对文献进行排名。
根据PageRank的原理,在文献排名的过程中,PageRank 算法同样遵循以下两个基本假设:
- 数量假设。如果一篇文献 A 被其他文献引用,说明其他文献认为文献 A 比较重要,也就是其他文献将自己的 PageRank 值贡献给 A。表明 A 是一篇有质量的文献,所以文献 A 的 PageRank 值会比较高。
- 质量假设。如果一篇高 PageRank 值的文献引用了一篇其他的文献,则被引用的文献的 PageRank 值也因此而提高。
算法的公式形式不变,如下所示,但是其中各个量的含义会发生变化。
其中
p
代表某个待评价的学术文献,
d
是阻尼系数。
CTotal
是文献总量。
N
表示
N </