Atitit 语音识别的技术原理

Atitit 语音识别的技术原理

1.1. 语音识别技术,也被称为自动语音识别Automatic Speech Recognition(ASR)2

1.2. 模型目前,主流的大词汇量语音识别系统多采用统计模式识别技术2

1.3. 基本方法般来说,语音识别的方法有三种:基于声道模型和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。2

1.3.1. 模板匹配的方法2

1.4. 一般来说,语音识别的方法有三种:基于声道模型和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。2

1.5. 提及语音识别,就不能不说Nuance,Nuance的语音技术是以统计推断方法为基础,着眼于音素(音节的声音)和语境来识别话语2

1.6. 神经网络这种技术可使得精确度提升25%以上,这是一个巨大的飞跃,因为这个行业只需要提升5%就具备革命意义3

1.7. 语音信号预处理与特征提取3

1.7.1. 基于语音学和声学的方法3

1.8. PCM文件,也就是俗称的wav文件。4

1.9. VAD静音切除4

1.10. 要对声音进行分析,需要对声音分帧,也就是把声音切开成一小段一小段,每小段称为一帧。4

1.11. 一个完整的基于统计的语音识别系统可大致分为三部分:5

1.12. MFCC特征 特征主要用MFCC等等5

1.13. 语音识别是怎么工作的呢,识别流程5

1.14. 隐马尔可夫模型(Hidden Markov ModelHMM6

1.15. 路径搜索的算法是一种动态规划剪枝的算法,称之为Viterbi算法,用于寻找全局最优路径。6

1.16. 这里所说的累积概率,由三部分构成, 观察概率 转移概率 语言概率6

1.17. 声学模型建模。7

1.18. 连续语音识别中的搜索,就是寻找一个词模型序列以描述输入语音信号,Viterbi7

1.19. 历史7

1.20. 声学特征 LPC  MFCC CEP Mel

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值