很久没更新博客了,最近找工作找的不是很顺利,我一直很看好语音的应用,觉得需求很多,但或许对应届生还是有些不一样,等确定了再分享下找工作的经验吧。这里主要说下语音识别现在大家都用的模型-----dnn-hmm,我自己也不能更好的去解释清楚,等我毕业前,我一定会把gmm-hmm和dnn-hmm的原理以最能理解的方式表达出来,我也很期待那一天。不多说了,直接说dnn-hmm。目前主流的方式是dnn-hmm,相信国内或者国外的用的都是这个,具体的应用主要参考li deng的这篇文章:Context-Dependent Pre-Trained Deep Neural Networks for Large-Vocabulary Speech Recognition。主要的算法我截图下:
语音识别基本原理介绍------dnn-hmm续
最新推荐文章于 2024-07-30 23:37:58 发布
本文介绍了dnn-hmm在语音识别中的应用,主要参考了li deng的文章,并指出当前主流方法是dnn-hmm。内容包括基于cd-gmm-hmm的模型构建,dnn的预处理和训练过程,以及如何利用gmm-hmm的对齐进行fine-tuning。推荐使用kaldi工具进行dnn-hmm的实现。
摘要由CSDN通过智能技术生成