PGNet模型训练注意事项:
- Coverage机制要在训练的最后阶段再加入(约占总训练时间的1%),如果从刚开始训练时就加入则反而影响训练效果;
- Copy机制在源文本的各个单词上的概率分布直接使用Attention机制计算的在源文本的各个单词上的概率分布;
一、概述
随着互联网飞速发展,产生了越来越多的文本数据,文本信息过载问题日益严重,对各类文本进行一个“降 维”处理显得非常必要,文本摘要便是其中一个重要的手段。
文本摘要旨在将文本或文本集合转换为包含关键信息的简短摘要。
1、文本摘要模型分类
按照输出类型可分为抽取式摘要和生成式摘要。
- 抽取式摘要从源文档中抽取关键句和关键词组成摘要,摘要全部来源于原文。
- 生成式摘要根据原文,允许生成新的词语、原文本中没有的短语来组成摘要。
“文本摘要”模型