Atitit 语音识别的技术原理

最新推荐文章于 2023-05-26 10:24:21 发布

attilax

最新推荐文章于 2023-05-26 10:24:21 发布

阅读量6k

点赞数

分类专栏：软件功能标准化 ide lib framework类库框架

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/attilax/article/details/53411788

版权

Atitit 语音识别的技术原理

1.1. 语音识别技术，也被称为自动语音识别Automatic Speech Recognition，(ASR)，2

1.2. 模型目前，主流的大词汇量语音识别系统多采用统计模式识别技术2

1.3. 基本方法般来说,语音识别的方法有三种：基于声道模型和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。2

1.3.1. 模板匹配的方法2

1.4. 一般来说,语音识别的方法有三种：基于声道模型和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。2

1.5. 提及语音识别，就不能不说Nuance，Nuance的语音技术是以统计推断方法为基础，着眼于音素（音节的声音）和语境来识别话语2

1.6. ，神经网络。这种技术可使得精确度提升25%以上，这是一个巨大的飞跃，因为这个行业只需要提升5%就具备革命意义3

1.7. 语音信号预处理与特征提取3

1.7.1. 基于语音学和声学的方法3

1.8. PCM文件，也就是俗称的wav文件。4

1.9. VAD静音切除4

1.10. 要对声音进行分析，需要对声音分帧，也就是把声音切开成一小段一小段，每小段称为一帧。4

1.11. 一个完整的基于统计的语音识别系统可大致分为三部分：5

1.12. MFCC特征特征主要用MFCC等等5

1.13. 语音识别是怎么工作的呢,识别流程5

1.14. 隐马尔可夫模型（Hidden Markov Model，HMM6

1.15. 路径搜索的算法是一种动态规划剪枝的算法，称之为Viterbi算法，用于寻找全局最优路径。6

1.16. 这里所说的累积概率，由三部分构成，观察概率转移概率语言概率6

1.17. 声学模型建模。7

1.18. 连续语音识别中的搜索，就是寻找一个词模型序列以描述输入语音信号，Viterbi7

1.20. 声学特征 LPC MFCC CEP Mel

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。