前言
CRF++是著名的条件随机场的开源工具,也是目前综合性能最佳的CRF工具。在这里我们简单介绍一下windows系统下CRF++的使用。
一、工具包的下载:
- CRF 的工具有两种,一种是支持Linux环境的,一种是支持Windows环境的,大家可以自行根据自己的系统进行下载。
(在此我下载的是CRF++0.58)
安装
-
在此先简单说一下Linux环境下的安装,后面我们主要介绍Windows环境下的使用。
- 解压到某一个目录下面
- 打开控制台,切换到解压目录
- 依次输入命令:
./configure
make
su
make install
- 注意:需要root权限才能成功安装。
-
在Windows下的安装很简单,其实严格来讲不能说是安装。我们解压我们下载的压缩包文件到某一个目录下面。你可能会得到如下所示的文件,(版本不同,可能会有所不同。)
-
- doc文件夹:就是官方主页的内容
- example文件夹:有四个任务的训练数据(test.data)、测试数据(train.data)和模板文件(template),还有一个执行脚本文件exec.sh。
- sdk文件夹:CRF++的头文件和静态链接库。
- clr_learn.exe:CRF++的训练程序
- crl_test.exe:CRF++的测试程序
- libcrffpp.dll:训练程序和测试程序需要使用的静态链接库。
实际上,需要使用的就是crf_learn.exe,crf_test.exe和libcrfpp.dll,这三个文件。
二、 一个小例子
训练过程
为了让大家尽快练练手,看到结果,我们先拿example中的某个例子做一下测试。例如:example中chunking文件夹,其中原有4个文件:exec.sh;template;test.data;train.data。将crf_learn.exe;crf_test.exe;libcrfpp.dll三个文件