ngram-count是SRILM语言模型库的一个命令,需要使用ngram-count的话,就必须安装SRILM库,在kaldi里安装这个库较为麻烦,这里做一个笔记。
1 下载SRILM库
看到网上很多介绍说去http://www.speech.sri.com/projects/srilm/download.html下载,但是根本访问不了,都有放弃安装的念头。遇到一个朋友,他跟我说BitSpeech/SRILMclone的。记得下载1.7.2的,1.7.3的我试了不管用
。
下载后请解压并更改文件夹命名为srilm,放到/data1/kaldi/kaldi-trunk/tools下
,具体呈现如下。
2 安装方法
vim修改上面的install_srilm.sh
部分如下:
【注意】 其实就是注释掉了三行,见#TODO update部分
# http://www.speech.sri.com/projects/srilm/download.html
if [ ! -f srilm.tgz ]; then
echo This script cannot install SRILM in a completely automatic
echo way because you need to put your address in a download form.
echo Please download SRILM from http://www.speech.sri.com/projects/srilm/download.html
echo put it in ./srilm.tgz, then run this script.
#exit 1 # TODO update 这行注释掉
fi
! which gawk 2>/dev/null && \
echo "GNU awk is not installed so SRILM will probably not work correctly: refusing to install" && exit 1;
#mkdir -p srilm # TODO update 这行注释掉
cd srilm
#tar -xvzf ../srilm.tgz # TODO update 这行注释掉
install_srilm.sh代码可可以在这里查看得到。