文章来源:
Arxiv,2018
作者:
Cibils Andre, Musat Claudiu, Hossmann Andreea, Baeriswyl Michael
关键词:
Extractiveness; Diverse Beam Search;Sent2Vec; MMR
问题:
如何降低生成式摘要的抽取性?
模型:
PGNet生成摘要由于可以选择是否利用拷贝机制,使得实际生成的摘要中从原文抽取的部分过多。这篇文章指出,现有的NLP指标——plagiarism score由于只关注LCS(longest common sequence),不能很好区分完全抽取和部分抽取的句子。于是文章提出了一个新的用于衡量抽取性的指标——extractiveness score