信号处理——梅尔滤波器（MFCC）

Fred_27

已于 2022-11-09 18:07:24 修改

阅读量5.8k

点赞数 4

分类专栏：信号处理文章标签：语音识别人工智能

于 2022-11-09 14:19:54 首次发布

本文链接：https://blog.csdn.net/Fredzj/article/details/127766909

版权

信号处理——梅尔滤波器（MFCC）

一、概述

在语音识别（Speech Recognition）和话者识别（Speaker Recognition）方面，最常用到的语音特征就是梅尔倒谱系数（Mel-scale FrequencyCepstral Coefficients，简称MFCC）。

梅尔倒谱系数是在Mel标度频率域提取出来的倒谱参数，Mel标度描述了人耳频率的非线性特性，它与频率的关系可用下式近似表示：

Mel(f)=2595∗lg(1+f/700)Mel(f)=2595∗lg⁡(1+f/700)

式中f为频率，单位为Hz。下图为Mel频率与线性频率的关系：
在这里插入图片描述

二、基本流程

在这里插入图片描述

1. 预加重

预加重处理其实是将语音信号通过一个高通滤波器：
在这里插入图片描述
式中的值介于0.9-1.0之间，我们通常取0.97。预加重的目的是提升高频部

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Fred_27

关注关注

4
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

语音特征参数MFCC提取过程详解

q6q6q的专栏

10-27

1243

折腾了好几天，看了很多资料，终于把语音特征参数MFCC搞明白了，闲话少说，进入正题。一、MFCC概述在语音识别（Speech Recognition）和话者识别（Speaker Recognition）方面，最常用到的语音特征就是梅尔倒谱系数（Mel-scale Frequency Cepstral Coefficients，简称MFCC）。根据人耳听觉机理的研究发现，人耳对不同频率的声波有不同的...

Mel滤波器组

百态老人的博客

12-22

1045

Mel滤波器组在音频处理中具有显著的优势，特别是在模仿人耳听觉感知、简化信号处理和适用于多种应用场景方面。然而，它在高频分辨率和参数选择方面存在一定的局限性。相比之下，小波变换在处理非平稳信号和提供恒定的时间-频率分辨率方面表现出色，但计算复杂度较高。在实时语音处理系统中，Mel滤波器组的计算效率和资源消耗情况如何？在实时语音处理系统中，Mel滤波器组的计算效率和资源消耗情况可以从多个方面进行分析。

参与评论您还未登录，请先登录后发表或查看评论

音频（六）Mel滤波器组_原理简介

chumingqian的博客

05-25

2万+

1. 背景为什么会产生出Ｍel 这种尺度的机制呢？这种产生是为了模拟，人耳朵的听觉机制；人耳朵具有特殊的功能，可以使得人耳朵在嘈杂的环境中，以及各种变异情况下仍能正常的分辨出各种语音；其中，耳蜗有关键作用; 耳蜗实质上的作用相当于一个滤波器组，耳蜗的滤波作用是在对数频率尺度上进行的，在1000HZ以下为线性尺度，　1K HZ以上为对数尺度，　使得人耳对低频信号敏感，高频信号不敏感；根据这一原则，从而研制出来了Ｍel频率滤波器组，　所以，　Ｍel滤波器组的在靠近低频出越密集，越靠近高频出

语音特征提取: 梅尔频谱(Mel-spectrogram)与梅尔倒频系数（MFCCS）

十年以上架构设计经验，专注于软件架构和人工智能领域，对机器视觉、NLP、音视频等领域都有涉猎

11-20

1万+

在音频处理和语音识别领域，Mel频谱（Mel-spectrogram）和梅尔频率倒谱系数（MFCC）都是常用的特征表示方法。两者都广泛应用，但在不同的应用场景中各有优势。

梅尔频谱介绍

最新发布

因为不想回家，所以还是去搬砖。

01-31

436

梅尔频谱（Mel spectrogram）是音频信号在梅尔尺度上的时频表示，常用于语音处理、音频识别等领域。它将频率的表示从线性尺度转变为梅尔尺度，模拟了人类耳朵对不同频率的感知方式。这段代码将音频文件加载到内存中，计算梅尔频谱并绘制出图像，横轴是时间，纵轴是梅尔频率，图中的颜色表示不同频率带宽的能量强度。：将传统的频谱映射到梅尔尺度，使用梅尔滤波器组对频谱进行滤波。：梅尔频谱通常以图像形式呈现，横轴表示时间，纵轴表示梅尔频率，颜色或亮度表示频带的能量强度。等库来计算梅尔频谱，并用。

深入理解梅尔刻度、梅尔滤波器组和梅尔时频谱图

DEDSEC_Roger的博客

12-10

8304

读取一段音频，使用短时傅里叶变换，得到普通的时频谱图，然后绘制梅尔滤波器组，值得注意的是，librosa的梅尔滤波器组函数还带有权重归一化功能，即对一个三角形滤波器的每个权重，都除以该三角形的面积，如果不希望进行该归一化，设置参数。从公式可见，对数部分可以以自然对数为底数，也可以以10为底数，不同的底数对应不同的系数，要确定当前的系数，只需要代入(1000Hz, 1000mel)即可。其中，m是当前滤波器的序号，表征了当前的时间段，k是当前频率的序号，表征了当前正在对哪一频率的。

Mel滤波器的原理

chumingqian的博客

03-21

2155

推荐阅读以下内容是 chat_gpt　回答的。

melfilter:为给定的频率向量生成一个 mel 滤波器组-matlab开发

05-30

% melfilter 创建梅尔频率滤波器组% % [Filter,MelFrequencyVector] = melfilter(N,FrequencyVector,hWindow) % % 生成具有 N 个线性间隔滤波器组的滤波器组矩阵， % 在 Mel 频域中，重叠了 50%。 % % `N` 要构建的滤波器组的数量。 % % `FrequencyVector` 一个向量，指示频率% 评估滤波器组系数。 % % `hWindow` 确定形状的窗口函数的句柄滤波器组的百分比。默认为 hWindow = @triang % % `Filter` 是大小为 [N numel(FrequencyVector)] 的稀疏矩阵。 % % `MelFrequencyVector` 是一个包含 Mel 频率值的向量% ％例子% N = 50; % Fs = 10000; % x = sin(2*

语音信号特征提取——梅尔频率倒谱系数MFCC（含Matlab代码）

Lostin_sakura的博客

07-21

8191

梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients，MFCCs) 这个词涉及到梅尔频率和倒谱，所以先分别了解这俩词的意思。 1. 倒谱（Cepstral）：（这个词是频谱spectrum的前面四个字母顺序倒过来，所以和频谱有一定联系）倒谱是一种信号的频谱经过对数运算后再进行傅里叶反变换得到的谱。其计算过程可用下面的框图表示：因为语音信号实际上是一个卷性信号（把声道看作一个线性时不变系统，声音的产生则为一个激励通过这个系统），记原时域信号为,经过DFT变换

语音信号特征提取——梅尔频率倒谱系数(MFCC)

Michael_fchou的博客

06-24

3550

** 语音信号特征提取——梅尔倒谱系数(MFCC) ** 一、什么是MFCC 梅尔倒谱系数（Mel-scale Frequency Cepstral Coefficients，简称MFCC）是在Mel标度频率域提取出来的倒谱参数。Mel标度描述了人耳频率的非线性特性，它与频率的关系可用下式近似表示：式中f为频率，单位为Hz。下图展示了Mel频率与线性频率的关系：二、为什么要用Mel频率对于人类听觉感知的实验表明，人类听觉的感知只聚焦在某些特定的区域，而不是整个频谱包络。而Mel频率分

数字信号处理——含均衡器、变调不变速、语音识别

03-29

在数字信号处理中，均衡器通常采用滤波器实现，可以分为线性相位和非线性相位两类。线性相位均衡器具有恒定的群延迟，适用于对时序要求严格的系统；非线性相位均衡器则能提供更灵活的频率响应调整。均衡器的应用广泛...

melbankm.rar_Mel滤波器_melbankm_melbankm代码_mel滤波器组

07-14

应用于语音识别，通过设置参数实通过mel滤波器组得到标准倒谱系数

语音信号处理——Python中用于信号处理的一小部分例程_Python_下载.zip

04-27

在本资源包“语音信号处理——Python中用于信号处理的一小部分例程”中，我们主要探讨的是如何利用Python这一编程语言进行语音信号的处理。Python因其丰富的库和易读性，成为了数据科学和信号处理领域的一个热门选择...

浅谈MFCC

热门推荐

fengzhonghen的专栏

06-20

6万+

MFCC(Mel-frequency cepstral coefficients):梅尔频率倒谱系数。梅尔频率是基于人耳听觉特性提出来的，它与Hz频率成非线性对应关系。梅尔频率倒谱系数(MFCC)则是利用它们之间的这种关系，计算得到的Hz频谱特征。主要用于语音数据特征提取和降低运算维度。例如：对于一帧有512维(采样点)数据，经过MFCC后可以提取出最重要的40维(一般而言)数据同时也达到了将维

MelFilter API 及mel 滤波器

行天之路

06-03

1225

mel滤波器组频率响应曲线_语音处理：滤波器组（Filter Banks），梅尔频率倒谱系数（MFCC）...

weixin_39876645的博客

11-20

4628

在使用深度学习训练模型时，我们需要先对语音信号进行变换，常用的提取特征的方法有梅尔频率倒谱系数(MFCC)和滤波器组(Filter Banks)。这篇文章讲讲如何对原始的语音信号做以上两种处理。语音处理在任何语音系统中都扮演着重要的角色，无论它是语音识别(ASR-Automatic Speech Recognition)还是声纹识别(Speaker Recognition)等等。梅尔频率...

什么是MFCC参数

ppp2006的专栏

11-10

2679

在语音识别工作中，我们最经常会遇到的特征就是MFCC参数。它的出现，仿佛让大家看了一种放之四海而皆准的特征，在不同的语音处理工作中都可以比较好的发挥其作用。相比通过对人的发声机理的研究而得到的声学特征LPC，Mel倒谱系数MFCC和感知线性预测PLP是受人的听觉系统研究成果推动而导出的声学特征。对人的听觉机理的研究发现，当两个频率相近的音调同时发出时，人只能听到一个音调。临界带宽指的

Mel-Scale Filter Bank(Mel Spectrogram 的具体实现)

子燕若水的博客

04-30

912

它的设计是为了模仿人耳感知声音的方式，根据梅尔音阶对频率进行建模，梅尔音阶对人类来说是一个比频率的线性音阶更有感知意义的尺度。梅尔滤波器组经常被用作语音识别系统的预处理步骤，在将语音信号输入分类器以识别语音模式之前，从这些信号中提取特征。Mel 滤波器组是一种将线性频率谱转换为 Mel 频率谱的方法。它通过将线性频率划分为若干个三角形滤波器来实现，每个滤波器对应一个 Mel 频带。Mel 频率刻度基于人类听觉感知，它与线性频率的关系是非线性的：在低频区域，Mel 频率与线性频率近似成线性关系；