作为序列标注器,CRF++在NLP领域有广泛用途。
https://taku910.github.io/crfpp/#download网站提供的 “Binary package for MS-Windows”在win10下运行会出错,因此选择在cygwin下安装此工具,步骤如下。
1. 从https://taku910.github.io/crfpp/#download下载CRF++-0.58.tar.gz
2. 修改winmain.h 文件,注释掉以下代码段,注释后的代码段如下(否则,会有编译错误):
/*
#define main(argc, argv) wmain_to_main_wrapper(argc, argv)
int wmain_to_main_wrapper(int argc, char **argv);
int wmain(int argc, wchar_t **argv) {
CommandLine cmd(argc, argv);
return wmain_to_main_wrapper(cmd.argc(), cmd.argv());
}
*/
3. 在cygwin下
% ./configure
% make
% make install
4. 测试
crf_learn -h