问题:
1.为什么MFCC是声纹特征参数
2.MFCC是怎么提取的,步骤
3.基于Mel刻度的三角滤波器组滤波的目地是什么?
1.为什么说MFCC是声纹特征参数
1.为什么MFCC是声纹特征参数
2.MFCC是怎么提取的,步骤
3.基于Mel刻度的三角滤波器组滤波的目地是什么?
1.为什么说MFCC是声纹特征参数
首先要理解声音是怎么传出的,人耳又是怎么获取识别的。激励源经过声道的振动(相当于滤波器组)后传出后被人耳所接收进行分析。
人耳耳蜗可以听取识别不同频率和强弱的声音,声波通过介质传入内耳,当橙骨足板推动前庭窗运动后,耳蜗内的液体也会运动,导致基底膜发生位移,其上外毛细胞弯曲,底部的神经末梢产生神经冲动,传到大脑我们就听到了声音。耳蜗常被认为是一组带通滤波器组,能将不同频率映射到基底膜的不同位置,基底膜每一个位置都对应一个特征频率,将这个频率的纯音信号传入时,该位置会发生最大幅度的振动。
MFCC是指Mel频率倒谱系数,Mel频率正是基于人耳耳蜗和基底膜的特性提出来的,与实际频率成非线性对应关系。在Mel频率的基础上进行滤波和倒谱分析,提取语音信号的频谱的包络信息,也就是反应声道和声门的信息。因为人体构造独特性的关系,所以我们将提取出来的信息作为特征值来标明人体身份。
人耳耳蜗可以听取识别不同频率和强弱的声音,声波通过介质传入内耳,当橙骨足板推动前庭窗运动后,耳蜗内的液体也会运动,导致基底膜发生位移,其上外毛细胞弯曲,底部的神经末梢产生神经冲动,传到大脑我们就听到了声音。耳蜗常被认为是一组带通滤波器组,能将不同频率映射到基底膜的不同位置,基底膜每一个位置都对应一个特征频率,将这个频率的纯音信号传入时,该位置会发生最大幅度的振动。
MFCC是指Mel频率倒谱系数,Mel频率正是基于人耳耳蜗和基底膜的特性提出来的,与实际频率成非线性对应关系。在Mel频率的基础上进行滤波和倒谱分析,提取语音信号的频谱的包络信息,也就是反应声道和声门的信息。因为人体构造独特性的关系,所以我们将提取出来的信息作为特征值来标明人体身份。
2.MFCC是怎么提取的,步骤