关于一些比较好的视频讲解：AIRMA和语音识别

瑾瑕Y

已于 2022-03-05 17:43:45 修改

阅读量2.7k

点赞数

分类专栏：笔记文章标签：算法数据结构 python

于 2022-03-05 16:22:38 首次发布

本文链接：https://blog.csdn.net/Mr_Carrot/article/details/123296668

版权

笔记专栏收录该内容

23 篇文章 0 订阅

订阅专栏

视频讲解

AIRMA

机器学习经典算法：时间序列ARIMA模型

语音识别

入门精选：从零搭建语音识别引擎 - 基于Kaldi

基于GMM-HMM语音识别系统的流程
关于语音识别的小提示：训练数据是音频外加对应的翻译文本
语音识别模型的输入数据是一帧一帧的mfcc vector。但是对于每一帧的mfcc vector来说，我们并没有对应的音素。我们并不知道哪一帧对应哪个音素，而这个问题也就是语音识别当中的对齐问题。针对这个问题可以从这个推荐视频的244p开始看。
我们现阶段的目标就是训练一个网络，其输入是一帧一帧的mfcc vector，其输出是与相应mfcc vector对应的音素。