语音识别
Leora_lh
这个作者很懒,什么都没留下…
展开
-
Kaldi中的nnet3之数据类型
简介本章涵盖了最新的nnet3。为了了解Kaldi里所有的DNN,例如例如karel的版本,参考 Deep Neural Networks in Kaldi。nnet3的创建是为了以更自然的方式不需要实际编码就支持更多通用种类的网络,而不仅仅是反馈网络(例如RNN和LSTM)。和nnet2一样支持多机器多GPU并行(利用基于naturalgradient-stabilized翻译 2017-08-08 16:22:44 · 2403 阅读 · 0 评论 -
kaldi中的深度神经网络
本文转自http://blog.csdn.net/wbgxx333/article/details/45641341只为加强自己的学习。综述这个文档主要来说kaldi中Karel Vesely部分的深度神经网络代码。如果想了解kaldi的全部深度神经网络代码,请Deep Neural Networks in Kaldi, 和Dan的版本, 请看Dan’s DNN imp转载 2017-08-14 15:30:20 · 2712 阅读 · 0 评论 -
声学模型学习笔记(五) SDT(MMI/BMMI/MPE/sMBR)
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.csdn.net/xmdxcsj/article/details/52760111DNN训练使用的CE准则是基于每一帧进行分类的优化,最小化帧错误率,但是实际上语音识别是一个序列分类的问题,更关心的是序列的准确性。所以引入SDT(sequence-disc...转载 2019-08-22 15:23:09 · 2189 阅读 · 0 评论 -
kaldi mmi/bmmi/mpe/smbr训练及源码
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.csdn.net/xmdxcsj/article/details/54695512训练流程make_denlats.sh产生1gram语言模型对应的解码网络nnet-latgen-faster产生denominator lattice,作为smb...转载 2019-08-22 15:42:21 · 974 阅读 · 0 评论