1.分析crf_model.txt
version: 100(版本号)
cost-factor: 1(默认为1,为了防止过拟合)
maxid: 50940
xsize: 1
cost-factor: 1(默认为1,为了防止过拟合)
maxid: 50940
xsize: 1
这是文件的开头部分:
maxid:特征函数的最大id(因为中文采用的是BMES标注,所以实际结果)
xsize:特征维度(训练的语料库列数减去1)
2.对训练好的crf_model文件进行测试
crf_test -v1 -m crf_model test_word_tag.txt > result.txt
# 0.998863
他 B S/0.999999
的 E S/0.999999
提 B B/0.999486
议 E E/0.999435
没 B B/0.999948
有 E E/0.999997
得 B B/0.999887
到 E E/0.999887
什 B B/0.999997
么 E E/0.999923
结 B B/0.999548
他 B S/0.999999
的 E S/0.999999
提 B B/0.999486
议 E E/0.999435
没 B B/0.999948
有 E E/0.999997
得 B B/0.999887
到 E E/0.999887
什 B B/0.999997
么 E E/0.999923
结 B B/0.999548