python中rouge是什么程序_Python pyrouge包_程序模块 - PyPI - Python中文网

我有纯文本格式的摘要,希望得到胭脂的分数

您可以这样评估纯文本摘要:from pyrouge import Rouge155

r = Rouge155()

r.system_dir = 'path/to/system_summaries'

r.model_dir = 'path/to/model_summaries'

r.system_filename_pattern = 'some_name.(\d+).txt'

r.model_filename_pattern = 'some_name.[A-Z].#ID#.txt'

output = r.convert_and_evaluate()

print(output)

output_dict = r.output_to_dict(output)

为了评估总结,Rouge需要知道你的总结在哪里

金本位的总结是,以及如何匹配它们。胭脂

用语言来说,你的总结是“系统”总结和黄金标准

摘要是“模型”摘要。摘要应该分开

文件夹,其路径设置为system_dir和model_dir

变量。所有摘要每行应包含一个句子。

自动将系统摘要与相应模型匹配

总结一下,pyrouge使用正则表达式。例如,假设

系统摘要使用固定名称和

变量数字标识如下:

一些名称.001.txt

一些名.002.txt

一些名称.003.txt

模型总结如下,用大写字母标识

给定文档的多个模型摘要:

一些名称.a.001.txt

一些名称.B.001.txt

一些名称.c.001.txt

一些名称.a.002.txt

一些名称.B.002.txt

system_filename_pattern中的组告诉pyrouge

文件名是id–在本例中是(\d+)。你必须使用圆

括号表示一个组,否则pyrouge将无法分辨

除了ID和文件名的其他部分。然后用那个身份证

查找所有匹配的模型摘要。特殊占位符#ID#

告诉Pyrouge它应该在哪里

model_filename_pattern。[A-Z]部分匹配多个模型

该ID的摘要。

完成配置后,调用convert_and_evaluate()get

你这胭脂是一串串的。如果您想进一步处理

分数,你可以用

output_to_dict(output)。

我只想预处理我的摘要,然后自己运行胭脂

要将纯文本摘要转换为Rouge能理解的格式,请执行以下操作:from pyrouge import Rouge155

Rouge155.convert_summaries_to_rouge_format(system_input_dir, system_output_dir)

Rouge155.convert_summaries_to_rouge_format(model_input_dir, model_output_dir)

这将转换system_input_dir和

model_input_dir,并将它们保存到各自的输出中

目录。

生成Rouge用来匹配系统和

模型摘要,do:from pyrouge import Rouge155

Rouge155.write_config_static(

system_dir, system_filename_pattern,

model_dir, model_filename_pattern,

config_file_path)

前四个论点在上面解释过。config_file_path

指定保存配置文件的位置。

从命令行使用pyrouge

如果您更喜欢命令行而不是python和pyrouge模块,则可以

使用以下脚本,这些脚本将自动安装并应

在系统的任何地方都可以运行:pyrouge_evaluate_plain_文本文件获得胭脂评分

你的纯文本摘要。示例:pyrouge_evaluate_plain_text_files -s systems_plain/ -sfp "some_name.(\d+).txt" -m models_plain/ -mfp some_name.[A-Z].#ID#.txtpyrouge_evaluate_rouge_format_文件获得胭脂分数

对于已转换为胭脂格式的摘要。示例用法

胭脂附带的sample-test/SL2003数据:pyrouge_evaluate_rouge_format_files -s systems -sfp "SL.P.10.R.11.SL062003-(\d+).html" -m models -mfp SL.P.10.R.[A-Z].SL062003-#ID#.html

注意,系统文件名模式用引号括起来

因为它包含特殊字符。pyrouge\u将纯文本转换为红色格式转换

将纯文本文件转换为胭脂能理解的格式。如果你的纯文本

文件每行不包含一个句子,此脚本还可以

分句,只要你有nltk和它的punkt语句

已安装拆分器。示例:pyrouge_convert_plain_text_to_rouge_format -i models_plain/ -o models_rougepyrouge_write_config_文件创建配置文件可以用来自己涂胭脂。示例:pyrouge_write_config_file -s systems -sfp "SL.P.10.R.11.SL062003-(\d+).html" -m models -mfp SL.P.10.R.[A-Z].SL062003-#ID#.html -c sl2003_config.xml

使用-h选项运行其中任何一个都将显示一条用法消息

解释各种命令行选项。

安装

有关安装胭脂的说明

here。

根据您的系统,您可能需要运行以下命令

作为根。

要安装pyrouge,请运行:pip install pyrouge

假设是工作胭脂-1.5.5。安装,告诉烟火胭脂

使用此命令的路径:pyrouge_set_rouge_path /absolute/path/to/ROUGE-1.5.5/directory

要测试是否安装正确,请运行:python -m pyrouge.test

如果一切正常,您应该看到如下内容:Ran 10 tests in 18.055s

OK

如果要卸载pyrouge:pip uninstall pyrouge

欢迎加入QQ群-->: 979659372

推荐PyPI第三方库

PyPI 帮助安装包程序

上传Python包

用户指南

常见问题

关于 PyPIPyPI 分享

设施仪表板

包索引名称

赞助商

Contributing to PyPI错误和反馈

贡献GitHub

翻译 PyPI

开发 credits

使用 PyPI行为准则

网站地图

隐私政策

使用条款

服务器状态: 正常

辽ICP备07000037号 ©2019~2020 WWW.CNPYTHON.COM PYTHON中文网

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值