生成式文本摘要论文复现
Global Encoding for Abstractive Summarization (ACL 2018)
原论文代码github地址:https://github.com/lancopku/Global-Encoding
这篇论文的模型是使用了生成式文本摘要中经典的带attention的seq2seq模型来作为论文的基线模型,代码结构十分清晰,bug很少,而且使用了中文的文本摘要数据集,因此可以作为生成式摘要的代码学习的一个参考。
该论文的解读:
Global Encoding for Abstractive Summarization论文解读
项目运行流程 :
1.项目环境配置:
Ubuntu 16.0.4
Python 3.5
Pytorch 0.4.1
pyrouge
tips:该代码不能直接在win系统上直接运行,因为代码中包含了对linux终端的命令。
服务器环境配置
使用anaconda建立虚拟环境,然后配置需要的python环境。(更多conda命令自行搜索)
conda create -n name python=3.5 #创建python版本为3.5,名字为name的虚拟环境
conda info --envs #列出所有已经存在的虚拟环境
source activate name #切换到名为name的虚拟环境
source deactivate #注销该环境
创建好虚拟环境后使用source activate name激活该虚拟环境,然后开始进行pytorch配置
该项目主要需要安装的包有:
pytorch 0.4.1
pyrouge
tips:还有一部分常用包比如matplotlib等,在运行时会提示缺失包,请自行安装。
下载地址推荐清华源,下载速度极快
链接地址: