NLP
文章平均质量分 80
tlight
这个作者很懒,什么都没留下…
展开
-
Sunpinyin中SLM训练数据生成举例
1.编译安装sunpinyin # sudo scons install 2. 新建文件夹slmdata # mkdir slmdata 3. 下载词典文件dict.utf8-20120823.tar.bz2从 http://sourceforge.net/projects/open-gram/files/, 并解压到slmdata.解压后得到文件dict.utf8 # tar -jxv原创 2015-11-22 20:34:02 · 872 阅读 · 0 评论 -
sunpinyin n-gram数据二进制和utf8格式的转换
1. 【目标】:将二进制的模型数据lm_sc.t3g转换成 utf8格式 lm_sc.t3g.arpa 【操作】: ./tslminfo -p -v -l ../raw/dict.utf8 ../data/lm_sc.t3g >../raw/lm_sc.t3g.arpa 【解释】: -p : 使用正常的频率值Pr, 非默认的-log(Pr) -v : 输出apra格式原创 2016-05-31 09:30:16 · 801 阅读 · 0 评论