1:pangrank
PageRank算法 -- 从原理到实现
https://blog.csdn.net/u013007900/article/details/88961913
将PageRank 从网页链接拓展到了 文本处理上。从有向图无权重图变成了无向有权图。
我们想了解 TextRank 就可以想从 PageRank 看起。
PageRank
PageRank算法可谓是大名鼎鼎了,在IT届要是没听过的人也是极少了。
这是一个用于评估网页重要度排序的算法。
公式如下
我的理解是:一个页面是否重要,由指向他的页面决定。
1. 如果指向他的页面越多,则他越重要;
2. 如果指向他的页面越重要,则他也越重要;
此时就形成了PageRank的基本思想,同时考虑到一个页面指向多个其他页面,那就将该页面的权重进行平分,就成了公式1。
2:TextRank
TextRank是由文本中的词所构建出来的共现词图计算的。其中边是由权重的
即wij 可以表示为第i个词于第j个词共同出现的频数。
而PageRank 的页面与页面之间是没有权重的,默认权重为1(或者大家初始值一样)