之前没有好好记录,现在从头做一遍记录一下训练的过程,后续会补充接口应用
工具包下载
有windows版的和linux版的,我是直接下载的windows版的,解压后就是编译好的了,可以直接用
解压完以后目录如下:
- doc文件夹:就是官方主页的内容
- example文件夹:有四个任务的训练数据(test.data)、测试数据(train.data)和模板文件(template), 还有一个执行脚本文件exec.sh。
- sdk文件夹:CRF++的头文件和静态链接库。
- crf_learn.exe:CRF++的训练程序
- crf_test.exe:CRF++的测试程序
- libcrffpp.dll:训练程序和测试程序需要使用的静态链接库。
实际上,需要使用的就是crf_learn.exe,crf_test.exe和libcrfpp.dll,这三个文件。
模型的训练与评估
可以先拿example中的某个例子,做一下测试。例如:example中chunking文件夹,其中原有4个文件:exec.sh;template;test.data;train.data。
- template为特征模版;
- test.data为测试数据;
- train.data为训练数据。关于它们具体格式和内容,待会详细介绍。
可以选择example里的某个例子做测试,比如选chunking。将crf_learn.exe;crf_test.exe;libcrfpp.dll三个文件复制到到,