参考https://svn.spraakdata.gu.se/repos/richard/pub/ml2015_web/assignment3.html
使用conlleval.txt对命名实体识别的结果进行测试时,注意以下几点:
1、只能接收BIO格式
2、第一列为字符,第二列为gold-standard annotation,第三列为预测的标签;
3、每一列数据之间用空格分隔。
4、运行命令perl conlleval.txt < test.py
5、运行时出现错误:unexpected number of features:1(4)
虽然网络上的提示大多使用-d 参数,但是我使用了之后仍然存在这个问题,最后的解决办法是:
读取当前文件,重新写入新文件时用空格进行分隔。