crf linux使用教程,Linux下CRF++的使用

Linux下CRF++的使用

在之前使用CRF++的过程中一直是再Windows下运行的,由于训练文本不大,所以很顺利,但为提高结果准确率而增加训练语料内容,随之也出现问题,因为用自己的机子做会使cpu占用率在训练迭代时瞬间达到100%而导致crf_learn.exe停止工作,如下图所以就转到服务器端训练了,然而也出现了一个问题,可能由于Windows下文件在Linux中是略有不同,所以运行时报错,如下:​

encoder.cpp(340) [feature_index.open(templfile, trainfile)]feature_index.cpp(174) [max_size == size] inconsistent column size:3 1 train404pos11.txt

也尝试将Windows文件中的换行符“\r\n”全部替换为“\r”但仍报错,尝试了几种其他的方法后,仍无结果。突然想起来在CRF++包中有自带一个example文件夹,就把里面的示例train.data拷到Windows下与我自己的文件对比一下到底哪里出了问题,用Notepad++打开这两个文件,“视图”-“显示符号”-“显示行尾符”,果然问题显现,如下图:​

3e67de2b2d8e40a631592aa10dad13e7.png

我的训练语料

3b30d6b4bfe7df461ced18b24efe3e3a.png

CRF++示例文件

如何能将我文档中的”CRLF“替换为只有”LF“呢?在网上找到了答案:”编辑“-”档案格式转换“-”转为unix格式“,总算跟示例文件格式一致了,又到服务器上测试一下效果如何,果然问题解决了,训练成功。

小贴士:如果选mac格式就是只有CR,如果是Windows就是都有。新建的文档默认应该是Windows格式​。

本文永久更新链接地址:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值