![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音识别
jiangtopaz
这个作者很懒,什么都没留下…
展开
-
基于DFSMN-CTC及CTC-CE联合训练的声学模型
参考文献:[1] A. R. Mohamed, G. E. Dahl, and G. Hinton, “Acoustic modeling using deep belief networks,” Audio, Speech, and Language Processing, IEEE Transactions on, vol. 20, no. 1, pp. 14–22, 2012...翻译 2019-05-06 11:22:43 · 2380 阅读 · 1 评论 -
批量统计多媒体文件的时长
在做语音识别的实验时,语音文件的总时长是个很重要的指标。我们单位有一批生语料,是在安静环境下的朗读文件。每个文件长短不一。为了得到所有文件的总时长,专门写了这段代码。代码在ubuntu16.04下,使用python2.7编写,用到的包有:commands,os,sys,需要系统安装mediainfo软件。主要思路是遍历文件夹下的所有媒体文件,对每一个文件使用mediainfo获取时长。单个文件...原创 2019-04-06 12:31:03 · 669 阅读 · 0 评论 -
kaldi 中查看gmm模型参数
cd path/of/kaldi/src/gmmbin/./gmm-info path/of/tri1/final.mdl原创 2019-05-13 17:27:01 · 650 阅读 · 0 评论 -
kaldi中查看深度学习模型参数
cd path/of/kaldi/src/nnetbin/./nnet-info path/of/final.nnet原创 2019-05-13 17:29:45 · 1012 阅读 · 0 评论