CRF++使用详情见 CRF++使用小结
01 问题
在应用CRF++训练模板时,由于数据规模较大,运行迭代了一次以后就停止,且不生成model,如下:
02 解决办法:
调整参数 -f NUM
这个參数设置特征的cut-off threshold。CRF++使用训练数据中至少NUM次出现的特征。默认值为1。当使用CRF++到大规模数据时,仅仅出现一次的特征可能会有几百万,这个选项就会在这种情况下起到作用。因数据规模大出现问题时,此处将此参数调整为 3
参数调整方式:
crf_learn -f 3 template_file train_file model_file
**效果:**由于数据量较大,迭代速度比较慢