kenlm使用说明
训练模型
使用以下命令:
bin/lmplz -o 3 --verbose_header --text data/noun.txt.seg --arpa result/nonu.arps -S 10%
将arpa文件转换为binary文件,可以对文件进行压缩,提高后续在python等其他编程语言中加载的速度。
bin/build_binary -s data/res.arpa data/res.bin
kenlm使用说明
训练模型
使用以下命令:
bin/lmplz -o 3 --verbose_header --text data/noun.txt.seg --arpa result/nonu.arps -S 10%
将arpa文件转换为binary文件,可以对文件进行压缩,提高后续在python等其他编程语言中加载的速度。
bin/build_binary -s data/res.arpa data/res.bin