TEXTRANK 和 PAGERANK

TextRank: Bringing Order into Texts
在网上看了很多关于pagerank和textrank的博客,关于pagerank的算法还算勉强能看懂,到了textrank就看不懂了,很多博客抄来抄去的,我只看懂了textrank是由pagerank演变而来的,但具体怎么实现还是看不懂,直到找到这篇2004年的原文,才恍然大悟。看英文原文确实费点时间,但是比起胡乱地找资料来说,反而更有效率。为避免自己忘记,在此通过原文记下自己地心得。

1 pagerank:

pagerank是很早谷歌提出的一种基于无权有向图的网页排序算法,把每个网页当作节点,每个节点上有评分,通过图的入度和出度对评分进行迭代计算,公式形式很简单:
在这里插入图片描述
S(Vi)表示节点评分,d为阻尼系数,通常设为0.85.
在这里插入图片描述
表示 j 节点指向其他网页的数量。

注意:为啥是无权有向图呢?作者的解释是一个网页节点指向另一个网页很少有多个重复的连接。然而NLP中可能需要有权的(下面介绍),因此对上面的公式进行了改进:

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值