自动文摘
Shirveon
这个作者很懒,什么都没留下…
展开
-
Ubuntu下配置pyrouge
自动文本摘要现在主流的评价标准ROUGE得分的计算需要使用pyrouge这个包,安装过程遇到很多坑,经过大量的探索试错终于得出了顺利的安装方法。特此记录,一则做个备忘,二来如果能为后来者提供一点帮助也算是功德一件。首先要安装ROUGE,成功之后设置pyrouge path,然后安装好pyrouge包。安装ROUGE参考点击打开链接设置pyrouge path 假设之前安装的ROUGE-1.5.5在...原创 2018-04-09 16:24:49 · 734 阅读 · 1 评论 -
论文笔记:Controlling Decoding for More Abstractive Summaries with Copy-Based Networks
来源:Arxiv, 2018关键词:PGNet; mixture coefficient; Decoding问题:现有生成式摘要系统(主要指PGNet)抽取性过高。模型:对解码过程进行控制,将生成模式和拷贝模式的混合系数(mixture coefficient)作为一个额外的优化目标。原得分函数:为了解决训练过程和解码过程中混合系数差别较大的问题,提出一个新的得分函数:m*是目标混合系数,后一个是...原创 2018-04-17 16:17:22 · 174 阅读 · 0 评论 -
论文笔记:Diverse Beam Search for Increased Novelty in Abstractive Summarization
文章来源:Arxiv,2018作者:Cibils Andre, Musat Claudiu, Hossmann Andreea, Baeriswyl Michael关键词:Extractiveness; Diverse Beam Search;Sent2Vec; MMR问题:如何降低生成式摘要的抽取性?模型:PGNet生成摘要由于可以选择是否利用拷贝机制,使得实际生成的摘要中从原文抽取的部分过多。...原创 2018-04-13 17:11:11 · 1061 阅读 · 0 评论 -
关于embedding
关于embedding的shape之前读pointer-generator代码的时候一直对tensor的shape概念感到比较混沌,今天再读有了新的收获。with tf.variable_scope('embedding'): embedding = tf.get_variable('embedding', [vsize, hps.emb_dim], dtype = tf.fl...原创 2018-06-07 10:28:39 · 707 阅读 · 0 评论 -
论文阅读:Keyphrase Extraction for N-best Reranking in Multi-Sentence Compression
作者: Florian Boudin and Emmanuel Morin 来源: 2013 NAACL-HLT 概述: 这篇文章扩展了Filippova (2010)’s word graph-based MSC方法,添加了一个re-reranking步骤,使得包含最多相关关键词的compression被选择出来。 资源: 1. 代码:https://github.com/boudi...原创 2018-07-25 21:34:22 · 1433 阅读 · 0 评论 -
自动文摘的METEOR评价指标
参考METEOR下载 详细文档$ java -Xmx2G -jar meteor-*.jar example/xray/system1.hyp example/xray/reference -norm -writeAlignments -f system1####exact match####java -Xmx2G -jar meteor-*.jar decoded reference -n...原创 2018-12-17 20:14:55 · 3964 阅读 · 1 评论 -
METEOR指标评估自动文摘
在尝试对生成的摘要进行METEOR指标评估时遇到的两个问题记录如下:issue1:python中os.listdir( )函数读取文件夹下文件的乱序import os#获取目标文件夹的路径filedir = os.getcwd()+'/decoded'#获取当前文件夹中的文件名称列表filenames = os.listdir(filedir)filenames.sort(key =...原创 2018-12-17 20:32:31 · 2197 阅读 · 0 评论