Speech
Yogurt0928
这个作者很懒,什么都没留下…
展开
-
HTK model转Kaldi model实录——convert_htk的使用
最近差不多一个星期的时间都在弄这个HTK model转原创 2014-11-13 19:10:40 · 2676 阅读 · 1 评论 -
Kaldi安装实录(一)
在接下来的工作中将要用到Kaldi这个yuy原创 2014-11-04 19:17:24 · 2035 阅读 · 0 评论 -
Kaldi安装实录(二)
接着昨天。今天弄的东西感觉比较多,不过可能是因为pengdaodemaga原创 2014-11-05 19:57:33 · 3561 阅读 · 0 评论 -
linux shell脚本如何将文本内容按空格分行、如何使用timit原始corpus制作wav的scp文件
在kaldi-trunk提供的例子voxforge中有一个online-demo直接使用就可以完成样例的在线解码并得到一个不错的结果,但是数据量很小前段时间试了一下用另一个corpus来做同样的事情,但是效果很差今天想用timit corpus来试一试在修改run.sh脚本过程中遇到了很多问题,主要是对shell脚本操作不熟悉其中有一个步骤是需要制作corpus中的wav的sc原创 2014-12-15 20:21:10 · 4733 阅读 · 0 评论 -
Kaldi下运行TIMIT实例需要对run.sh进行修改的部分(不包括DNN部分)
这两天试了一下使用kaldi-trunk/egs/timit/s5下的run.sh对timit corpus从提取特征开始的整个过程。run.sh这个文件里面已经把所有的过程都包含在里面,从提取特征到training到decoding到evaluation。所以需要改动的地方并不多,这里把我在一步一步执行中需要改动的部分以及遇到的问题列举一下。Line30-32 改成你机器上原创 2014-12-05 20:12:02 · 2837 阅读 · 0 评论 -
Kaldi随笔(一)
最近需要解决一个问题:在Kaldi下做完DNN训练之后,要怎么得到一段录音feature的后验概率,以及在有了这个后验概率之后怎么知道每一帧对应的是哪个状态,同时又是对应哪个phone。首先,如何得到一段录音feature的后验概率。由于DNN训练已经做完,已经得到了训练后的网络,那么只要把feature放进这个网络里面进行一遍从头到尾的运算,就可以得到这个后验概率。在Ka原创 2015-04-24 16:43:19 · 3988 阅读 · 1 评论 -
Kaldi随笔(二)
今天思考的还是昨天那个问题的延续。现在已经知道了nnet-forward输出的矩阵的每一列对应的是一个pdf,我的最终目的是想要知道每一帧(除了sil)转换成每一个phone的概率是多少。首先我看到了Kaldi的kaldi-trunk\egs\wsj\s5\steps\nnet下有一个align.sh的脚本。然后我找到了之前跑TIMIT实验的时候这个脚本处理后得到的ali文件,解压之后原创 2015-04-25 21:23:41 · 2019 阅读 · 1 评论 -
LoadHTKList: Label Name Expected
https://github.com/prosodylab/Prosodylab-Aligner/issues/15转载 2016-08-31 18:23:16 · 1116 阅读 · 0 评论