![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音识别
shaobo Huang
化繁为简,高效极致
展开
-
基于HMM的语音识别技术原理
语音怎么变文字,今天看到了一篇深入浅出的文章。首先,我们知道声音实际上是一种波。常见的mp3、wmv等格式都是压缩格式,必须转成非压缩的纯波形文件来处理,比如Windows PCM文件,也就是俗称的wav文件。wav文件里存储的除了一个文件头以外,就是声音波形的一个个点了。下图是一个波形的示例。在开始语音识别之前,有时需要把首尾端的静音切除,降低对后续步骤造成的干扰。这个静音切除的操作一般称为VAD,需要用到信号处理的一些技术。要对声音进行分析,需要对声音分帧,也就是把声音切开成一小段一小段,每小段称转载 2020-08-03 17:16:19 · 4441 阅读 · 0 评论 -
Tensorflow教程之语音识别
1、概述本人从事语音方面的开发工作,通过音频和代码实战tensorflow是最直接有效的学习方式,先从简单的语音识别和tensorflow代码开始来了解这个体系2、与传统语音识别的对比传统的语音识别是基于语音学的方法,通常包含拼写、声学和语音模型等单独组件。训练模型的语料除了标注具体的文字外。还要标注按时间对应的音素,这就需要大量的人工成本。(标记因素是个很大的坑)而使用神经网络的语音识别就...原创 2019-11-19 10:01:03 · 13009 阅读 · 38 评论