MITIE是一个MIT信息提取库,该库使用了最先进的统计机器学习工具构建。它类似于word2vec中的word embedding。MITIE模型,在NLU(自然语言理解)系统中,完成实体识别和意图提示的任务。
MITIE在Windows系统下的安装,要费点儿劲。鉴于网上介绍该部分内容的资料较少,这里做一个安装的分享。
MITIE安装需要有Visual Studio环境、cmake、boost。注意,这三种缺一不可。
1、安装Visual Studio
做过C#开发的童鞋,肯定很熟悉Visual Studio,即VS。windows 的集成开发环境。安装该环境的同时,它会附带安装很全的windows的类库。后面boost库运行的时候,需要使用其中的类库。
具体安装过程很简单,完全傻瓜式安装即可,下一步下一步搞定。这里提供一个下载地址:
2、安装cmake
官网下载:https://cmake.org/download/
解压后把bin目录路径,配置到path环境变量中。
例如:D:\develop-environment\cmake-3.12.3-win64-x64\bin
执行文件为:
cmake.exe
cmake-gui.ext
cmcldeps.exe
cpack.exe
ctest.exe
确保安装成功:
3、安装boost
官网下载:https://www.boost.org/
因为官网下载需要翻墙,百度网盘提供一个: https://pan.baidu.com/s/1LOgKv_S-JdvUNZ2UQBNCjA 提取码: eeuw
我本机boost的解压目录为:
D:\develop-environment\boost\boost_1_67_0
cd D:\develop-environment\boost\boost_1_67_0\tools\build
bootstrap.bat
.\b2 --prefix=D:\develop-environment\boost\bin install
确保安装成功:
4、安装MITIE
pip,是通用的Python包管理工具。使用pip安装MITIE的方式有很多种,我主要看了两种方式。一种在线现在安装;一种自己下载下来安装,归根底还是一种方式。
pip install git+https://github.com/mit-nlp/MITIE.git
确保安装成功:
至此,mitie就安装成功了,接下来,我们就可以把分好词的预料文件放在同一个文件路径下,进行mitie模型训练了。