MFCC特征提取及MATLAB代码分析(一)

本文介绍了MFCC特征提取的过程,包括预加重、分帧加窗、FFT、Mel滤波器组和倒谱分析,并详细分析了MFCC提取的参数,如采样频率、帧时、帧移、预加重系数、窗函数等的选择及其作用。
摘要由CSDN通过智能技术生成

本文不涉及MFCC的理论,所以读此文前请对MFCC以及相关语音信号处理有初步认识。本文重点在于代码实现的分析。

先对MFCC有个初步认识。

MFCCs(Mel Frequency Cepstral Coefficents)是一种在自动语音和说话人识别中广泛使用的特征。提取MFCC特征的过程包括:

1)对语音进行预加重、分帧和加窗;

2)对每一个短时分析窗,通过FFT得到对应的频谱;

3)将上面的频谱通过Mel滤波器组得到Mel频谱;

4)在Mel频谱上面进行倒谱分析,获得Mel频率倒谱系数MFCC,这个MFCC就是这帧语音的特征。

下面对MFCC提取的实现进行分析。

1. 参数分析

MFCC程序需要输出什么?当然是MFCC参数了。如果愿意,还可以将帧(windowed frames)、滤波器组能量(filterbank energies)也一起输出,这样以后用到了也方便。

MFCC程序的输入参数呢?

总的来说有语音信号、采样频率、帧时、帧移、预加重系数、窗函数、频率范围、Mel滤波器个数、倒谱系数个数和提升参数。

下面一个一个来分析。

首先是语音信号(speech signal),这没得说,用matlab一句wavread搞定。比如

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值