记录conlleval.pl的使用
conlleval.pl是用来评估BIO序列标注任务的脚本。
1. 安装perl
我安装的是strawberry-perl-5.32.1.1-64bit,下载地址如下。
https://pan.quark.cn/s/b238861132ae
安装过程很简单,和大部分软件一样,直接点next就可以。
2. 测试perl是否安装成功。
打开cmd,输入命令“perl -v”,出现版本信息说明安装成功。
3. 下载conlleval.pl
下载链接如下 https://pan.quark.cn/s/9773612a8e64
下载的文件包括conlleval.pl与conlleval.md,conlleval.md中介绍了待评估文件(包括词汇、真实词汇标记、预测标记)的存储方式。如下所示:
将下载的eval文件夹放到序列标注任务的项目中。
4. 执行conlleval.pl
(1)打开anaconda prompt或cmd,跳转到项目所在的位置;
(2)输入命令
perl ./conlleval.pl < 保存的待评估文件
示例如下:我保存的待评估文件名称为"tmp.txt"
评估结果如上图所示,包括“处理了56590个令牌和16560个短语;发现:16283个短语;正确:12952。”以及精确率、准确率、召回率、f1值,最后一列数字代表什么没有搞明白????
5. 实例
我最初的目的只是做一个序列标注任务,然后在github上发现了人家完成的项目,结果运行发现还要使用conlleval.pl脚本。
github项目地址:https://github.com/llhthinker/slot-filling
为了方便大家下载,将此项目存到了夸克网盘地址中:
https://pan.quark.cn/s/6de37d845037
######结语:这是我第一次写知识博客,希望自己能再接再厉!