[论文阅读]《A Template-based Abstractive Meeting Summarization》

本文介绍了一种模板驱动的会议摘要生成方法,包括模型生成和摘要生成两个阶段。模型生成通过归纳人写摘要,用上义词替代名词形成模板,并通过词网聚类和融合。摘要生成涉及话题分割、词组提取和模板填充,依据评分标准选择最佳句子生成摘要。
摘要由CSDN通过智能技术生成

本文是一篇较老的文章了,发表于2014年。文章所提出的思路为生成摘要模型,选择摘要模型,填写摘要模型。作者以会议的摘要为提取对象,所有的语料都是有主讲人的主动语态的句子。

这里主要介绍系统的整体架构:
整个系统分为两个大的模块,离线的模型生成阶段和在线的摘要生成阶段。

1. 模型生成阶段

  • 第一步,从由人写的摘要中归纳,将其中的名词用一个上义祠(个人理解就是这个词是该名词的母集,e.g. 猫,狗等名词的上义祠为动物。通过WordNet来获得相应的上义祠)来替代。然后将这些名词当做模板中的空白部分,在之后的步骤中填补这些空白来生成文本摘要,整个句子就是模板的最初形态。

上义祠

  • 第二步,进行聚类,根据不同模板的主要动词(root verb)生成一个全连接网络,计算两个模板之间的相似度(先比较两个动词在WordNet中出现的频率,然后计算动词到对应的上义祠在网络中的最短路径,以此来作为两个模板的相似度)。接下来把全连接网络转化为一个相似矩阵,并利用正则化剪枝,就形成了以主要动词为中心的聚类。
  • 第三步,模型融合,将上一步聚类的结果,生成一个单词网络(word Graph),网络中的节点为单词,连接的边表示两个单词是邻接的关系。其中单词网络的生成规则为:首先给定第一个点和

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值