MFCC整理

MFCC(Mel频率倒谱系数)是声纹特征参数,因为它基于人耳对声音频率感知的特性,能提取语音的声道和声门信息。MFCC的提取包括将语音信号转为Mel频率滤波、倒谱分析等步骤,用于减少冗余并突出人耳敏感的频率成分。Mel刻度滤波器组的目的是模拟人耳对不同频率的敏感度,降低频域信号的复杂性,便于特征提取。
摘要由CSDN通过智能技术生成
问题:
1.为什么MFCC是声纹特征参数
2.MFCC是怎么提取的,步骤
3.基于Mel刻度的三角滤波器组滤波的目地是什么?

1.为什么说MFCC是声纹特征参数
   首先要理解声音是怎么传出的,人耳又是怎么获取识别的。激励源经过声道的振动(相当于滤波器组)后传出后被人耳所接收进行分析。
   人耳耳蜗可以听取识别不同频率和强弱的声音,声波通过介质传入内耳,当橙骨足板推动前庭窗运动后,耳蜗内的液体也会运动,导致基底膜发生位移,其上外毛细胞弯曲,底部的神经末梢产生神经冲动,传到大脑我们就听到了声音。耳蜗常被认为是一组带通滤波器组,能将不同频率映射到基底膜的不同位置,基底膜每一个位置都对应一个特征频率,将这个频率的纯音信号传入时,该位置会发生最大幅度的振动。
   MFCC是指Mel频率倒谱系数,Mel频率正是基于人耳耳蜗和基底膜的特性提出来的,与实际频率成非线性对应关系。在Mel频率的基础上进行滤波和倒谱分析,提取语音信号的频谱的包络信息,也就是反应声道和声门的信息。因为人体构造独特性的关系,所以我们将提取出来的信息作为特征值来标明人体身份。
2.MFCC是怎么提取的,步骤
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值