在使用CRF++进行命名实体识别时进行训练时,出现问题如下:
原因: template特征模版格式与train.txt不一致,存在无法访问的项。
template特征模版内容如下:
而template模版对应的train.txt中内容如下:
解决:修改template特征模版
修改为如下模版:
参考:
Win环境下安装CRF++及python接口配置(可以在pycharm中Import)
faliure in reading training data: tagger.cpp (393) CRF++
关于CRF++命名识别的教程:
Python自然语言处理实战(4):词性标注与命名实体识别
CRF++模型格式说明
CRF++ for NER
CRF++