麦克风阵列语音识别——(make machine understand us)

基于麦克风阵列增强的语音识别

基于麦克风阵列增强的语音识别,与单通道语音识别相比麦克风阵列可以利用多通道的语音信息,通过波束形成算法来增强语音信号的质量,这样提取的特征参数能更好的反应语音的特征,从而提高语音识别的效果。

麦克风阵列可接收到多路的语音信息,可以通过对多路语音信息以某种准则加以筛选整合,得到对识别更有利的通道的语音信息,从而达到提高识别率的目的。通道选择的方法有很多种,比如基于 SNR 的方法,基于特征补偿的方法,基于互相关系数法,基于最近邻法。

语音识别的基础理论知识 


语音识别过程本质上是一种模式识别过程,首先麦克风将接收到语音信号转换成电信号,经过预处理和端点检测后对其进行特征参数提取。然后根据语音特点选择合适的语音模型,通过提取的特征参数建立起语音识别的参考模型。最后,对待识别的语音进行预处理、端点检测和特征参数提取,将待识别语音的特征参数与训练过程建立语音模型进行匹配,进而通过判决规则得出识别结果。

153720_eYX5_2352897.png

(http://blog.csdn.net/ziyuzhao123/article/details/8932336)

梅尔倒谱系数

语音特征参数可以是基音周期、短时能量、共振峰等。目前在语音识别系统中,常用的特征参数是和线性预测倒谱系数。

HMM 模型的基础知识

隐马尔科夫模型是语音信号的一种统计模型,在语音处理各个领域广泛应用。它具有双重随机过程的特点,系统由多个状态组成,观察序列随着时间的变化转移到不同的状态上;每个状态又含有不同的输出概率模型,根据输出概率模型得到观察序列的输出概率。一段语音的特征参数就是随着时间的变化而变化的,隐马尔科夫模型很好的模仿了这一过程,所以其成为公认的相对有效地语音识别模型。

根据状态输出观察值的概率连续与否可将 HMM分为离散 HMM、连续 HMM、半连续 HMM。

HMM 模型的基本算法 

前向后向算法

前向后向算法是在已知一个观察序列和一个 HMM 模型的基础上,计算出通过HMM 模型产生观察序列的概率。前向算法是按照观察序列的时间顺序,从前往后递推计算出输出概率。

http://blog.csdn.net/joey_su/article/details/17270639

http://blog.csdn.net/joey_su/article/details/17270613

HMM 模型在应用中存在的问题及解决方法 

HMM 模型的基元选取和状态数确定 

基元即语音识别的最小识别单位,对于汉语来说,可以是一个词,也可以是声韵母。一般中小词汇量的系统选择以词为基元,大词汇量的系统一般以声韵母作为基元。

当识别系统词汇量比较大时,如果每一词都有一个 HMM,那么整个系统所需要训练的参数会大大增加,其所存储的空间也会增加,这两不利于系统的实用化。所以可以选择一组包含所有声韵母的训练语音,即可训练出各个声母韵母的 HMM 模型,这样既节省了存储空间,又提高了训练时间。

通过查阅文献可知,一般汉语语音识别,以词为基元的,状态数宜为 6 到 8。以声韵母作为基元的,声母状态数为 2,韵母状态数为 4。

http://www.cs.ubc.ca/~murphyk/Software/HMM/hmm.html?spm=5176.100239.blogcont.16.PXoxr2

https://yq.aliyun.com/articles/50423

关于麦克风阵列延迟滤波求和

多个通道采集语音信号时,由于到达各个通道的各路信号是经过不同的传播延迟后获得,因此可对各通道信号进行时间校正以补偿信号在传输时所产生的时延,实现各个通道的期望信号无相位差叠加,而噪声则为存在相位差的叠加,进而提高输出信号中的信号与噪声的比值。这个过程用数学公式可表达为

161109_PqFT_2352897.png

FBFout=sum(x)/M;

而当麦克风阵列接收的各路语音信号在求和之前通过一个滤波器,此时权值系数不再是单一的数值,而是由一系列滤波器系数组成,那么即可以由延时求和波束形成的方法推广到滤波求和波束形成的方法。

161049_fidt_2352897.png

 


 
 

转载于:https://my.oschina.net/u/2352897/blog/685649

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值