CRF++:一款基于c++高效实现CRF的工具。在基于条件随机场的命名实体识别时,用到CRF++,而且提供了python接口,可以使用命令行来执行,但配置了python接口就可以在任意文件夹下运行文件了。非常有必要。
好,接下来讲讲我的跳坑之旅。
初时crfpp一脸懵,并不知道干啥的,环境也不像第三库一样好装易用,但是人家功能强大,没办法,只能勉强上手。
因为涉及到机器学习,大部分程序都在Linux环境下跑,so准备在服务器上装一下。
Linux环境安装之旅:
-
首先你的Linux环境上得安装gcc3.0以上版本,相当于在Linux上的visual studio,具体安装过程不详述。
测试环境是否装gcc以及版本:
输入gcc -v
若出现版本信息则说明安装成功。
这里我下载了一个mingw-get-setup,据说是在Windows上安装gcc,安装后发现不会使,也研究不明白,果断弃之安装了vs2015。
在这贴出链接,给有需要的伙伴分享。
链接:https://pan.baidu.com/s/108FZcpftlMPGApT6hMUEKw
提取码:4ri5 -
下载crfpp
https://github.com/taku910/crfpp
直接下压缩包,解压后放到文件夹下。
当然,你也可以直接在服务器上下载,不过速度可能偏慢,若服务器有流量限制也不太好操作,反正在电脑上下载了直接拖到服务器上也不是啥难事。
还是给出直接在服务器下载的代码.git clone https://github.com/taku910/crfpp.git
-
进入刚刚下好解压后的文件夹下。
cd crpff-master
-
命令行输入
./configure
之后输入用户密码。我在进行到这一步的时候就出错了。原因是安装需要root权限。
报错:`configure: error: working directory cannot be determined -
命令行输入
make
当然,前提是你前几步都没错。 -
命令行输入
sudo make install
完事儿
windows环境安装之旅:
由于Linux环境出了点小问题,so改为在Windows下试一哈。Windows安装的前提也是你有c++环境。
环境:Windows10(64位)+Anconda3(python3.6)
安装包:CRF++ 0.58(下载地址:https://github.com/TATlong/CRF 找了好久的资源,感谢大神贡献)
VS2015(社区版、个人版、企业版都ok,因为目前官网上默认版本是VS2017,2015版本链接不好找,所以给出个人版和企业版你的下载链接及密钥,同样感谢大神贡献)
Visual Studio Professional 2015简体中文版(专业版)下载地址:
http://download.microsoft.com/download/B/8/9/B898E46E-CBAE-4045-A8E2-2D33DD36F3C4/vs2015.pro_chs.iso
SHA1: 629E7154E2695F08A3C692C0B3F6CE19DF6D3A72
激活密钥:HMGNV-WCYXV-X7G9W-YCX63-B98R2
Visual Studio Enterprise 2015简体中文版(企业版)下载地址:
http://download.microsoft.com/download/B/8/F/B8F1470D-2396-4E7A-83F5-AC09154EB925/vs2015.ent_chs.iso
SHA1: 4FFA1EE3E2D3337D3EDAE550A3583ABE9C426BEF
激活密钥:HM6NR-QXX7C-DFW2Y-8B82K-WTYJV
windows10 一下版本安装可能会有一些小问题,大家具体问题自行百度。
1.安装vs2015
下载好vs2015安装包后,解压安装,如果在安装时选择了默认安装方式,将不具备Visual C++,so选自定义安装,勾选如下图所示选项,开始安装。(时间比较长,要有耐心啊!)
`安装成功后,重启计算机。
2.下载CRF++ 0.58
链接之前已给出,现在直接下载后解压就可以
接下来配置python接口,对Windows和Linux环境都适用。
配置python接口。
参考如下博客:https://blog.csdn.net/lilong117194/article/details/81204349
然后打开Anaconda Prompt 控制平台,输入一下命名:
(base) C:\Users\LiLong>cd C:\Users\LiLong\Desktop\CRF++-0.58\python
(base) C:\Users\LiLong\Desktop\CRF++-0.58\python>python setup.py build
如果不再base环境下配置则直接进入该环境下配置,命令
activate (环境名称)
成功后再输入python setup.py install
无错则配置成功,进入python输入import CRFPP
测试一下是否配置成功。
完整命令如下:
配置成功后在CRF++ 0.58/python 文件夹下生成一个libcrfpp.dll文件
把该文件移动到你所要运行的文件中,crf模块即可运行成功。
程序菜鸟,不足之处,请多包涵,欢迎探讨,转载请注明出处。