KenLm的环境安装及使用总结

本文详细介绍了KenLM环境在Ubuntu 18.04上的安装步骤,包括Python版本升级、软件源修改、Boost、XZ、Zlib、Bzip2的安装,以及最后KenLM的构建与测试。通过这个过程,读者可以成功搭建起KenLM模型的运行环境。
摘要由CSDN通过智能技术生成

KenLm的环境安装及使用总结

前言

最近,在学习宗庆后的统计自然语言处理中的N元文法求句子概率时,老师介绍了两个模型(KenLM和SRILM)可以从语料库中训练并建模,求出概率。目前使用比较好的有KenLM及SRILM模型,其中KenLM比SRILM晚出来,训练速度也更快,而且支持单机大数据的训练。本文主要对KenLM的分析。

前提配置

  1. VMware workstation Pro 15
  2. UbuntuDesktop 18.04(配置尽量高,虚拟机内存尽量在8G,双处理器,双核)
  3. clone一份虚拟机,以防第一个崩掉,可以及时使用clone的,不用等太长时间再安装

环境配置的过程及步骤

1.python版本修改

由于Ubuntu18.04中的python版本有两个,一个是2.7,一个是3.6,我们可以两个都不用,下载一个最新的版本,以防后续命令由于版本不匹配导致异常。

wget https://www.python.org/ftp/python/3.7.4/Python-3.7.4.tgz

#解压文件
tar zxvf Python-3.7.4.tgz

#进入安装目录
sudo ./configure

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值
>