【srilm语言模型训练】基于srilm的语言模型训练
准备
srilm是一个语言模型训练工具,在训练模型之前需要对文本数据进行处理,得到分好词的文本数据。分好词的文本数据大概是下图这样。关于srilm的安装和配置可以在其他博客学习。
同时,我们还需要准备一个词典lexicon.txt,大家可以自行建立自己的词典或者获取其他已经建立好的词典作为lexicon。词典在这里的作用是我们在训练模型之前需要对文本数据中出现的词进行一个统计。统计每一个词在文本...
原创
2020-04-23 16:36:57 ·
1032 阅读 ·
0 评论