PositionRank提取关键词与TextRank相似,都是基于PageRank的图关系计算词的得分。用S(V_i)表示词的重要性得分,其公式如下:
(1)
其中,表示词的初始得分归一化后的值。
(2)
词的初始得分跟词的在文本中的位置成反比,跟词频成正比。假定词v在文本的第2,第3,第8位置出现,p=1/2+1/3+1/8。
a(alpha)表示阻尼因子,一般设为0.75
w表示图的边的权重,即词之间的相似度。
O(v_j)表示词v_j所有出向边的权重和。
PositionRank提取关键词与TextRank相似,都是基于PageRank的图关系计算词的得分。用S(V_i)表示词的重要性得分,其公式如下:
(1)
其中,表示词的初始得分归一化后的值。
(2)
词的初始得分跟词的在文本中的位置成反比,跟词频成正比。假定词v在文本的第2,第3,第8位置出现,p=1/2+1/3+1/8。
a(alpha)表示阻尼因子,一般设为0.75
w表示图的边的权重,即词之间的相似度。
O(v_j)表示词v_j所有出向边的权重和。