哈工大LTP编译使用

介绍

哈尔滨工业大学的社会计算与信息检索研究中心研发的“语言技术平台(Language Technology Platform, LTP)”是一个全套的中文自然语言处理系统。
这里主要介绍LTP的使用配置。
LTP采用C++开发,这里简单记录以下使用LTP开发的过程(Windows系统)。

C++版本使用

  1. 下载源代码,自行编译,具体步骤可以参考LTP的在线文档;另外下载数据文件。

    值得注意的问题:使用CMake工具共建VC项目,点击Configure,需要正确选择是64位还是32位版本的Visual Studio。

  2. Visual Studio编译是最好选择Release。

  3. 测试1:命令行运行bin\Release\ltp_test.exe,提示出错,缺少ner.dll,需要复制lib\Release\ner.dllbin\Release目录中。
  4. 测试2:新建VC++ Win32 Console Application,测试代码使用LTP源代码中的example目录中的,构建项目需要设置为编译LTP的方式,保证库的平台一致,如Release x64。参考文档中的步骤,添加头文件和库。

    获取静态库文件名,命令行dir /b your-lpt-dir\lib\Release\*.lib > libfielist.txt

  5. example中文件的问题:The file contains a character that cannot be represented int the current page code(936),新建cpp文件,复制代码(主要是文件编码不是GBK)。或者【File】->【Advanced Save Options】,选择Encoding为“Unicode - Codepage 1200”

  6. 运行缺少dll文件,复制dll文件到运行文件的目录中。

Python

参照文档:pip install pyltp(使用管理员权限)
问题:缺少Visual C++相关库,下载VCForPython27.msi.

Java

使用ltp4j。
0. 编译LTP源文件;
1. 下载ltp4j源文件,ant编译获得jar包(在output目录中);
2. CMake构建VC++项目,需要修改CMakeLists.txt中的LTP_HOME为LTP源代码目录,另外建议修改link_directoris (${LTP_HOME}/lib/Debuglink_directoris (${LTP_HOME}/lib/Debug,因为LTP源代码使用Release编译。
3. 测试:建立java项目,添加jar文件到Build Path,ltp4j\libs\Release中6个_jni.dll文件和ltp\lib\Release中对应的6个dll复制到项目根目录(即Eclipse中Java Project中src目录的上一级,与.classpath.project文件同一级)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值