一、抽取式摘要
传统 的抽取式摘要方法使用 图方法、聚类 等方式完成无监督摘要。
基于神经网络的抽取式摘要往往将问题建模为 序列标注 和 句子排序 两类任务。
1.1 传统方法
1.1.1 Lead-3
一般来说,作者常常会在标题和文章开始就表明主题,因此最简单的方法就是抽取文章中的前几句作为摘要。常用的方法为 Lead-3,即抽取文章的前三句作为文章的摘要。Lead-3 方法虽然简单直接,但却是非常有效的方法。
1.1.2 TextRank
TextRank 算法仿照 PageRank,将 句子 作为节点,使用句子间相似度,构造 无向有权边