生成式文本摘要分析实践

本文探讨了生成式文本摘要的两种方法,重点分析了基于深度学习的Seq2Seq模型在文本摘要领域的应用,尤其是Google的textsum模型。尽管Seq2Seq模型能生成抽象句子,但针对特定文章生成摘要仍具挑战,训练效率低且结果不稳定。此外,Tensorflow框架虽然资源丰富,但调参复杂,运行效率待提升。
摘要由CSDN通过智能技术生成

1     短版

自动生成文本摘要主要有两类方法,第一类是通过关键词,位置等多种特征,摘取原文内容做摘要,简称“摘取式摘要”。第二类是通过深度学习模型学习大量数据进行编码,解码,产生抽象的摘要内容,摘要内容来源不限于原文内容,简称“生成式摘要”。

 

第一类方法是传统摘要方法,常见应用于新闻摘要,但是该方法扩展性,通用性很有限,难以适应多变的文本内容。

 

第二类方法是最新基于深度学习的方法,可以应用于各种文本,不过生成的摘要通常是一句话,不适合生成比较长的摘要(难度太大)。这种方法是近两年,学术界研究的热点内容。主要模型就是深度学习的模型之一,Seq2Seq 模型,同时加上Attention学习机制。其中Seq2Seq模型,是由两个深度学习模型组成,一个负责对原文进行编码(encode),一个负责对摘要进行解码(decode),通常采用RNN模型(包含LSTM,GRN等变种模型),也可以使用其他深度学习模型。

 

Seq2Seq模型示意图:


由于近些年深度学习的发展很热,在2015年到2016年期间,学术界出现了大量基于深度学习(主要是Seq2S

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值