语音识别特征—MFCC（理论篇）

最新推荐文章于 2020-10-29 16:18:09 发布

Xwei1226

最新推荐文章于 2020-10-29 16:18:09 发布

阅读量1.6k

点赞数 2

分类专栏：语音识别-深度学习文章标签：语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Xwei1226/article/details/105790052

版权

语音识别-深度学习专栏收录该内容

64 篇文章 36 订阅

订阅专栏

语音特征提取—MFCC(理论篇)

本文为语音特征提取—MFCC理论部分，参考哥伦比亚大学语音识别代码进行提取，其具体流程如下：

（1）预加重、分帧以及加窗

语音识别中特征提取过程首先进行预加重、分帧以及加窗操作，其具体理论如下：

1.1 预加重

语音信号的预加重，目的是为了对语音的高频部分进行加重，去除口唇辐射的影响，增加语音的高频分辨率，其定义如下：

一阶FIR高通数字滤波器来实现预加重，其中a为预加重系数，0.9<a<1.0。设n时刻的语音采样值为x(n)，经过预加重处理后的结果为y(n)）=x(n)-ax(n-1),这里取a=0.98。

1.2 分帧

1.3 加窗

（2）傅里叶变换

语音中傅里叶变换主要是将时域语音信号转化到频率中，其理论部分可以参考：https://blog.csdn.net/manmanxiaowugu-n/article/details/84590396

（3）Mel滤波

首先给出Mel滤波理论部分，主要是将经过FFT后的语音数据点通过Mel滤波器组进而可以达到更好的效果，其定义如下：

先将频率域f转移至Mel域，再对Mel域进行语音信号处理，最后与语音功率进行乘积累加得到一帧语音经过Mel滤波结果，其中Mel滤波器组定义如下：

笔者为进一步阐述上述理论，对FFT于Mel域信号进行进一步阐述，并给出了具体推导方法：

大家不要把Mel滤波器组想的很多是，实际上就是一个分段函数，对FFT后语音信号提取其中H值，最后与对应FFT信号的功率谱进行乘积，最后累加得到。

（4）DCT变换

所谓DCT即是对经过Mel滤波器组的语音信号进行再变化，上式为具体计算流程。

至此，语音特征—MFCC 理论推导完毕！

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
语音识别特征—MFCC（理论篇）

语音特征提取—MFCC(理论篇) 本文为语音特征提取—MFCC理论部分，参考哥伦比亚大学语音识别代码进行提取，其具体流程如下：（1）预加重、分帧以及加窗语音识别中特征提取过程首先进行预加重、分帧以及加窗操作，其具体理论如下...
复制链接

扫一扫

专栏目录

Xwei1226 CSDN认证博客专家 CSDN认证企业博客

码龄7年

58: 原创

3万+: 周排名

216万+: 总排名

37万+: 访问

: 等级

4710: 积分

494: 粉丝

228: 获赞

209: 评论

961: 收藏

私信

关注

热门文章

分类专栏

kaldi 20篇
感悟 2篇
paper reading 4篇
matlab 1篇
python 11篇
shell 3篇
杂谈 1篇
linux基本操作 12篇
语音工具 2篇
语音识别-深度学习 64篇
CNN 4篇
TensorFlow基本操作 16篇
全连接网络 4篇
RNN 3篇
机器学习 1篇
人脸识别 2篇
sklearn 3篇
git 1篇
pytorch 2篇

最新评论

语音识别中特征提取MFCC、FBANK、语谱图特征提取
没头发的小言: filepath = '/home/zhangwei/PycharmProjects/ASR_MFCC/datalist/test.word.txt' 这个里面的路径是随便给一个就可以了吗
语音识别中特征提取MFCC、FBANK、语谱图特征提取
m0_74272131: 博主麻烦也拉我一下Hzk2582809329，谢谢！
语音识别三年研究感想
qq_41787484: 您好博主，我是研0一枚，马上就是詹青燃前辈的学弟了哈哈非常想进入社群和大家交流，vx是17602538773，非常感谢！
语音识别三年研究感想
qq_41787484: 博主您好!我是研0一枚，而且我马上也是詹青燃前辈的学弟哈哈~ 非常想进社群和大家交流，我的微信：17602538773.求拉，谢谢前辈！
语音识别三年研究感想
「已注销」: 您好博主，我是研一的，想进群学习一下，可以拉我吗？我的vx是1142244382，谢谢啦

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。