CRF++是条件随机场的一个开源应用,官方手册和网上的使用说明都有说明。
有个不错的链接:我爱自然语言处理:CRF中文分词
这里补充一点:
训练样本中的最后一列,作为分类结果,不能在template文件中出现。
The column index starts from 0. If you have 6 column in your BIO file. The template should not have something like %x[0,5]
CRF++是条件随机场的一个开源应用,官方手册和网上的使用说明都有说明。
有个不错的链接:我爱自然语言处理:CRF中文分词
这里补充一点:
训练样本中的最后一列,作为分类结果,不能在template文件中出现。
The column index starts from 0. If you have 6 column in your BIO file. The template should not have something like %x[0,5]