采用conlleval_rev.pl出现未知实体问题

如题,conlleval_rev.pl是命名实体识别计算precision,recall和F1分数的常用工具,但在使用过程中容易出现如下图所示问题:

processed 223833 tokens with 15018 phrases; found: 15097 phrases; correct: 12041.
accuracy:  98.08%; precision:  79.76%; recall:  80.18%; FB1:  79.97
                 : precision:  73.12%; recall:  73.67%; FB1:  73.39  7366
                 : precision:  73.12%; recall:  73.67%; FB1:  73.39  7366
              LOC: precision:  89.94%; recall:  84.55%; FB1:  87.16  3439
              ORG: precision:  73.65%; recall:  83.94%; FB1:  78.46  2490
              PER: precision:  95.89%; recall:  92.70%; FB1:  94.27  1802

即,在计算结果中出现未知实体类别,冒号左边显示为空。显然出现该问题一定是左后的标签文件出现问题,因此,应该从生成的标签着手,如下图:

我 O O
们 O O
变 O O
而 O O
以 O O
书 O O
会 O O
友 O O
, O O
以 O O
书 O O
结 O O
缘 O O

本人的解决方案是,将标签大写字母“O” 替换为数字‘0’,然后,,,,,然后就解决了,神奇不?

processed 112188 tokens with 3819 phrases; found: 4074 phrases; correct: 3252.
accuracy:  97.55%; precision:  79.82%; recall:  85.15%; FB1:  82.40
              LOC: precision:  87.07%; recall:  82.16%; FB1:  84.55  1841
              ORG: precision:  62.09%; recall:  86.89%; FB1:  72.43  1377
              PER: precision:  92.76%; recall:  89.82%; FB1:  91.26  856

小编只是采用conlleval_rev.pl进行计算,未深究其语言perl,如果懂行的道友,还请解释一下为什么把字母O换成‘0’就行了。。。。。?

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值