kenlm使用 C++

本文档详细介绍了如何在C++项目中编译和使用kenlm语言模型库,包括依赖库的安装、CMakelists.txt的修改以及解决编译问题。同时,提到了在自己工程中使用kenlm时的CMakeLists.txt编写注意事项。
摘要由CSDN通过智能技术生成

简介

近期需要使用语言模型对句子打分,因此需要用到第三方开源库kenlm,在此记录下使用过程。因为python下使用kenlm比较简单,这里就不做介绍了,本博客主要针对将kenlm编译到自己工程中的方法做一个大致记录。

源码编译

kenlm编译需要依赖几个库,如下:
zlib、bzip2、Boost、xz
具体详见:
https://kheafield.com/code/kenlm/dependencies/

依赖库安装

  1. boost安装
    下载boost_1_62_0.tar.gz并解压
    ./bootstrap.sh
    ./b2 install
  2. zlib安装
    下载xz-5.2.2.tar.gz并解压
    cd xz-5.2.2
    ./configure
    make
    make install
  3. zlib安装
    下载 zlib-1.2.11.tar.gz并解压
    cd zlib-1.2.11
    ./configure
    make
    make install
  4. bzip2安装
    下载bzip2-1.0.6.tar.gz并解压
    cd bzip2-1.0.6/
    make
    make install

修改CMakelist.txt

kenlm源码默认编译生成静态库文件,如下所示:
kenlm编译生成文件
为了方便在自己项目中使用,需要修改自带的CMakelist.txt文件,编译成动态库文件
如下所示:
kenlm编译so文件
具体步骤如下:
在安装完依赖库后,修改kenlm源码中的CMakelist.txt文件,一共需要修改四个,路径分别为
kenlm/lm/CMakeLists.txt、kenlm/lm/filter/CMakeLists.txt、kenlm/lm/builder/CMakeLists.txt、kenlm/util/CMakeLists.txt
修改add_library()命令,示例如下:

add_library(kenlm_builder ${
   KENLM_BUILDER_SOURCE}) 改为add_library(kenlm_builder SHARED ${
   KENLM_BUILDER_SOURCE})

将生成静态库的都改为动态库

注意

编译时可能会报错误:
报错
这是因为编译libbz2.a时没有采用 -fPIC
解决方法:修改 zlib-1.2.11/Makefile文件,将CFLAGS行改

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值