文本摘要

è¿éåå¾çæè¿°

方法分类:

  • 抽取式(传统基于统计学的)
    相关算法:Text rank排序算法、BM25算法、TFIDF

  • 生成式(Automatic Summarization)

    • seq2seq+attention
      1. sequence2sequence
      2. 2016year,cnn FAIR encoder &rnn decoder [FAIR ,Facebook AI Research]
      3. 2017/5 FAIR CNN encoder&decoder , multi-step Attention ,同时引入残差网络
      4. 2017/6 Google self-Attention & encoder-decoder attention《Attention is All you Need》
    • Pointer N

评价方法:

  • Edmundson
    说明:标准摘要必须完全从文章中整句摘出,不允许概括抽象,评分以匹配数占比作为评分
  • ROUGE
    说明:基于摘要中n元词的共现信息来评价摘要,面向n元词召回率的评价方法
  • Rouge-L
    L即最长公共子序列的首字母

如何去衡量一个句子的重要性 

  1.  句子长度 
  2.  句子位置 
  3.  句子中词语的TFIDF 
  4.  句子是否包括线索词 
  5.  句子是否与标题相似

 实战http://blog.itpub.net/29829936/viewspace-2641920/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

贾世林jiashilin

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值