SRILM是一个应用比较广泛的统计和分析语言模型的工具,另外,还有 Kenlm,IRSTLM,MITLM等语言模型工具。本文就SRILM的安装和使用做简单的介绍。
SRILM的主要目标是支持语言模型的估计和评测。估计是从训练数据(训练集)中得到一个模型,包括最大似然估计及相应的平滑算法;而评测则是从测试集中计算其困惑度。其最基础和最核心的模块是n-gram模块,这也是最早实现的模块,包括两个工具:ngram-count和ngram,相应的被用来估计语言模型和计算语言模型的困惑度。
下载:
http://www.speech.sri.com/projects/srilm/download.html
在此网站上下载,需要填写个人信息后,点击accept进行下载。
解压:
tar zxvf srilm-1.7.2.tar.gz
准备:
在安装SRILM之前首先通过tclsh命令检查是否安装tcl工具(tcl脚本解释工具)未安装的情况,需要下载编译: