《TextRank: Bringing Order into Texts》

摘要

TextRank是一个图排序模型,还是一个非监督方法。可用于关键字提取和短语提取。

TextRank模型

TextRank基于全图,递归获取全局信息,来决定每个顶点的重要性。

其中,d是阻尼系数,通常取0.85。(论文Brin and Page,1998)。
TextRank算法运行结束后,每个顶点的最终取值与初始值得选择是无关的。初始值得选择只会影响算法迭代到收敛的次数。

权重图

权重图的公式稍微不同于上式:

把文本当做图处理

顶点:单词、短语、全部的句子,等等
边:词汇或者语义上的关系、前后关系上的重叠,等等

主要步骤



评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值