前言
这次做自然语言处理的作业,是关于多文档摘要生成的,其中对于生成的摘要进行效果测评需要用到ROUGE(不是那个文本高亮的插件!!)。没想到安装这个软件这么麻烦,于是写个博客造福后人了。
ROUGE简介
ROUGE是由微软亚洲研究院知识挖掘组(The Knowledge Mining group at Microsoft Research Asia)调研经理(research manager) Chin-Yew Lin 研发的,用于摘要的自动评价,通过比较机器自动生成的摘要(called system_summary)与人工生成的摘要(called model_summary, 认为它是理想的)中重叠单元的数量,来评价机器自动生成的摘要。该方法中考虑的重叠单元有n-gram, word sequences, word-pairs等,并提出了四个测量标准ROUGE-N, ROUGE-L, ROUGE-W, ROUGE-S。
该包用Perl语言编写,目前版本为ROUGE-1.5.5。
ROUGE安装教程
说实话ROUGE真心是难装,按理说在Ubuntu下几行命令就应该要安装成功一个程序,可是ROUGE完全没有体现这一点。
安装要求
1. 需要安装perl解释器(ubuntu 系统已自带, 通过perl -v可查看当前版本);
2. 需要额外安装perl解释器的XML::DOM模块以及DB_File模块,而XML::DOM的安装又需要XML::RegExp、XML::Parser、LWP::UserAgent和XML::Parser::PerlSAX模块(对,就是这么恶心);
3. 设置系统环境变量ROUGE_EVAL_HOME,需要设置为ROUGE安装目录下词库data所在路径
获取方法
现在不知道官网是哪个了,不过可以从github上获取,也可以从我的百度网盘(1.5.5版本)获取,另外其他依赖的模块包我也放进这个网盘链接里了,可以一起下载省去寻找的麻烦。