在命名体识别任务(NER,Named Entity Recognizer)中,Evaluate使用Perl的conlleval.pl
for example:(例子来源于link)
El Aa O O
consejero a O O
de a O B-MISC
Economía Aa B-MISC I-MISC
Industria Aa I-MISC I-MISC
Comercio Aa I-MISC I-MISC
Manuel Aa B-PER B-PER
Amigo Aa I-PER I-PER
为了使用perl的evaluation工具,我们运行如下命令
perl conlleval.perl < output_file_name
或者 conlleval.pl < output_file_name
便可以得到:
processed 10 tokens with 2 phrases; found: 2 phrases; correct: 1.
accuracy: 80.00%; precision: 50.00%; recall: 50.00%; FB1: 50.00
MISC: precision: 0.00%; recall: 0.00%; FB1: 0.00 1
PER: precision: 100.00%; recall: 100.00%; FB1: 100.00 1
为了实现上述过程,我们需要安装perl,下载 conlleval.pl…如下:
环境搭建
- 平台: win10
- 下载地址: link(ps:perl的window的版本有ActiveState Perl,Strawberry Perl,初学者建议前者。之前又看到原因,等我再找到放个链接吧)
- 安装就是一路狂点next,注意安装的路径,我默认的c盘
安装完成后会有两个文件
2.hello world
一般第一个程序都是输出hello world,不过他自己有这个例子,在C:\Perl64\eg
里有个example.jl
,用记事本打开就是
我们打开cmd,切换到C:\Perl64\eg
这个路径输入
perl example.pl
输出:
3.conlleval.perl的使用
原本可以直接下载 conlleval。
若官方链接挂了, 可参考此处: conlleval.pl
将下载下来的 txt 文档,改名为 conlleval.pl 或者任何你喜欢的。然后放到C:\Perl64\eg
里。
自己生成一个测试用的data
North B-MISC B-MISC
African E-MISC B-MISC
we O O
Grand B-MISC I-MISC
Prix E-MISC E-MISC
we O O
保存为dataset.txt
依旧放在C:\Perl64\eg
里。
在cmd里面输入
conlleval.pl < dataset.txt
输出
4.julia实现的chunk的evaluate
待更新