人工智能之语音识别技术(二)

1. 语音识别技术的重要性

各种终端设备的智能化和集成化程度越来越高,传统的信息检索和菜单操作方式已经越来越无法满足需求。迫切需要一种更加便捷的信息检索和命令方式来替代传统的按键操作。

语音识别技术的基本内容包括以下内容:

  • 语音识别基本单元
  • 语音识别流程
  • 语音识别技术应用

2 语音识别基本单元

语音识别系统组成
语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单元。
在这里插入图片描述

语音识别研究领域分类
在语音识别系统中,可以根据不同的方式对语音识别的研究进行分类。
在这里插入图片描述

3 语音识别流程

基于HMM的语音识别过程

  • 在开始语音识别之前,通常需要把首尾段的静音切除,降低对后续步骤的干扰。这个静音切除的操作一般称为VAD。
    在这里插入图片描述

  • 分帧,也就是把声音切开成多个小段,每小段称为一帧。
    在这里插入图片描述

  • 波形变换:常用的一种方法是MFCC特征,通过12维度的向量来描述一帧的波形,12维向量是根据耳朵的生理特征提取的,这一过程称为声学特征提取。
    在这里插入图片描述

  • 矩阵变成文本

    1. 把帧识别成状态;
    2. 把状态组合成音素;
    3. 把音素组合成单词。
      在这里插入图片描述
  • 语音识别过程总结
    在这里插入图片描述

4 语音识别最新进展

最新进展

  • 目前,国外的应用一直以苹果的Siri,谷歌的Google Now为代表。
  • 国内国内方面,科大讯飞、云知声,百度语音等系统都采用了最新的语音识别技术,市面上其他的相关产品也直接或间接潜入了类似的技术。
    在这里插入图片描述
  • 0
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值