今天搞毕设了么?——4.15 MFCC及倒谱系数

原创 2018年04月15日 23:11:51

浅谈MFCC  

MFCC的基本过程可以看看这个,(1)浅谈MFCC(2)声音特征提取但这个也就是个基本的过程,毕设的基本理论方面是可以用的到的,而具体详细实现的细节及代码后续再做补充。

MFCC最直观的认知,它的13个系数(也许还有13个一阶差分和13个二阶差分)都是通过离散余弦变换(DCT)而来,并取前13个系数。DCT


所说,为了获得频谱的倒谱,倒谱的低频分量就是频谱的包络,倒谱的高频分量就是频谱的细节,这些都是语音识别上经过科学验证十分有效的语音物理信息。但语音识别是对机器来说的,所以我们必须对物理信息进行某种“编码”,得到的就是MFCC13维特征向量,你是否理解它不重要,只要机器能够识别就行了。

综上所述,我认为MFCC的物理含义就是——在语音识别领域,将语音物理信息(频谱包络和细节)进行编码运算得到的一组特征向量。

在知乎上看到这样一个很直观的例子  Mel频率倒谱系数对应的物理含义

首先看下面图中的波形,如果你“播放”它,其实就是鼓声“咚哒咚咚哒”这五声儿。


把这段鼓声分成130帧,每一帧内提取20维的MFCC,就会得到下图:


可以看到“咚”和“哒”的时候对应的MFCC还是有区别的,为了让这个区别更明显,可以对每一维的系数稍作处理,于是得到下图:


附录python源码:

# 需要用到的包
import numpy, scipy, sklearn, librosa
# 录入咚哒咚咚哒的音频例子
x, fs = librosa.load('example.wav')
# 画出波形图(上方第一个图)
librosa.display.waveplot(x, sr=fs)
# 提取MFCC
mfccs = librosa.feature.mfcc(x, sr=fs)
# 获取特征值的维度
print mfccs.shape  #打印将输出(20,130)
# 画出MFCC的图(上方第二个图)
librosa.display.specshow(mfccs, sr=fs, x_axis='time')
# 对MFCC的数据进行处理
mfccs = sklearn.preprocessing.scale(mfccs, axis=1)
# 画出处理后的图(上方第三个图)
librosa.display.specshow(mfccs, sr=fs, x_axis='time')


MFCC梅尔倒谱系数

MFCC梅尔倒谱系数是说话人识别、语音识别中最为常用的特征。我曾经对这个特征困惑了很久,包括为什么步骤中要取对数,为什么要最后一步要做DCT等等,以下将把我的理解记录下来,我找到的参考文献中最有价值的...
  • richard2357
  • richard2357
  • 2013-12-05 20:09:26
  • 6391

MFCC 梅尔频率倒谱系数

推荐到我的主页 http://www.poodar.me去查看相关信息。 TERM: MFCC 梅尔频率倒谱系数 在任何的自动语音识别系统中,第一步一般都是提取特征,也就是识别出音频信...
  • AMDS123
  • AMDS123
  • 2017-06-04 19:39:17
  • 1162

梅尔频率倒谱系数(MFCC)的提取过程与C++代码实现

MFCC参数提取步骤 ——>预加重 ——>分帧 ——>对每一帧加窗 ——>对每一帧补零 ——>各帧信号的FFT变换及其功率谱 ——>梅尔滤波(通过40个滤波器) ——>取对数 ——>DCT变换 ——>...
  • Xiao13Yu14
  • Xiao13Yu14
  • 2015-07-21 20:38:00
  • 5575

MFCC倒谱系数特征提取与识别

首先,整合一下上一篇的基本内容:MFCC参数的提取过程。 耳蜗实质上相当于一个滤波器组,耳蜗的滤波作用是在对数频率尺度上进行的,在1000HZ下,人耳的感知能力与频率成线性关系;而在1000HZ以上,...
  • zm1_1zm
  • zm1_1zm
  • 2016-09-27 22:34:17
  • 1118

MFCC倒谱系数

1.       什么是MFCC? MFCC是Mel频率倒谱系数(melfrequency cepstrum,MFCC)的缩写,Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。M...
  • zm1_1zm
  • zm1_1zm
  • 2016-09-25 20:09:44
  • 923

语音信号梅尔倒谱系数(MFCC)计算,matlab代码

  • 2016年04月18日 20:53
  • 1KB
  • 下载

音频特征-梅尔频率倒谱系数(MFCC)详解

总结一些关于MFCC写的比较好的资源: 1. MFCC提取过程讲解的非常详细,形象(图表多): http://blog.csdn.net/zouxy09/article/details/91567...
  • zzc15806
  • zzc15806
  • 2018-02-03 14:28:47
  • 329

MFCC(Mel 倒谱系数)

Mel倒谱系数 Mel倒谱系数:MFCC   Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient)的缩写是MFCC,Mel频率是基于人耳听觉...
  • fanmengmeng1
  • fanmengmeng1
  • 2015-10-09 15:20:01
  • 1965

梅尔频率倒谱系数(MFCC)教程

The first step in any automatic speech recognition system is to extract features i.e. identify the c...
  • MRX220518
  • MRX220518
  • 2017-05-26 17:40:35
  • 639

利用梅尔倒谱系数(MFCC)及空间聚类算法实现音色识别

写在前面 2016年4月参加了哈尔滨工业大学深圳研究生院举办的创新创业比赛,司职算法组长,切入点定在了音色识别和相似明星音才艺展示推荐算法上,不才,拿到了一等奖,趁佳节未散与大家分享。 项目进度安...
  • u013576018
  • u013576018
  • 2017-02-08 12:47:51
  • 1473
收藏助手
不良信息举报
您举报文章:今天搞毕设了么?——4.15 MFCC及倒谱系数
举报原因:
原因补充:

(最多只允许输入30个字)