Towards Constructing Sports News from Live Text Commentary读书笔记

分享的这篇论文讲的主要是从体育赛事的直播文本当中自动生成新闻,个人对这个方向很感兴趣,而且也觉得这个方向非常具有研究前景,在这里简单谈一下我对这篇论文的看法。

综述:

作为该方向上的一个初步研究,作者将此作为一个特殊的文档摘要任务,采取句子抽取的方式来处理。将足球比赛的直播文本作为输入,基于LTR(Learning to Rank)模型利用传统的句子特征以及为该任务特别设计的句子特征来给句子打分,根据句子的得分排名选择其中的一部分来构成新闻;为了解决局部冗余问题,采用基于DPP(Determinantal Point Process)的句子概率选择算法来生成最终的新闻摘要。实验结果表明该方法很适合这个任务并且在很多方面比baseline更加优越。

1、简介

论文的主要目的是实现依据足球比赛的解说直播文本内容自动生成赛事新闻,作为一个初步研究,将这个任务视为一个特殊的文档摘要任务:从比赛的直播文本中抽取句子生成新闻。

由于解说直播文本的一些特性,给系统的实现带来了挑战:1、几乎每一分钟都会有很多句子描述不同的事件;2、文本内容按照时间的顺序排序,很多重要的事件没有凸显;3、解说员更喜欢使用简单的,重复的词来描述同一种类的关键事件,并且以短句子居多,这将会使生成的新闻有很高的冗余度。

论文的主要贡献总结如下:

  • 构建了数据集
  • 基于LTR模型利用传统特征和Task-specific特征
  • 提出一个概率句子选择算法解决冗余问题
  • 实验结果表明任务的可行性,并且提出的方法比一些strong basilin
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
11-08 952
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值