【NLP】关键词提取之PositionRank详解

PositionRank提取关键词与TextRank相似,都是基于PageRank的图关系计算词的得分。用S(V_i)表示词的重要性得分,其公式如下:

                                                                                     (1)

其中,表示词的初始得分归一化后的值。

                                                        (2)

词的初始得分跟词的在文本中的位置成反比,跟词频成正比。假定词v在文本的第2,第3,第8位置出现,p=1/2+1/3+1/8。

a(alpha)表示阻尼因子,一般设为0.75

w表示图的边的权重,即词之间的相似度。

O(v_j)表示词v_j所有出向边的权重和。

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值