TextRank 实际就是 PageRank 2.0
将PageRank 从网页链接拓展到了 文本处理上。从有向图无权重图变成了无向有权图。
我们想了解 TextRank 就可以想从 PageRank 看起。
PageRank
PageRank算法可谓是大名鼎鼎了,在IT届要是没听过的人也是极少了。
这是一个用于评估网页重要度排序的算法。
公式如下
(1) S ( V i ) = ( 1 − d ) + d ∗ ∑ j ∈ I n ( V i ) 1 O u t ( V j ) S ( V j ) S(V_i) = (1- d) + d * \sum_{ j \in In(Vi) }\frac{1}{Out(V_j)} S(V_j) \tag{1} S(Vi)=(1−d)+d∗j∈In(Vi)∑