MFCC研究（一）之语音信号的同态解卷积【已补全,20130602】

最新推荐文章于 2023-06-21 15:52:45 发布

hns20070

最新推荐文章于 2023-06-21 15:52:45 发布

阅读量4.1k

点赞数 1

分类专栏： MFCC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hns20070/article/details/9002175

版权

本文探讨MFCC的基础，重点在于理解倒谱以及同态解卷积在语音信号处理中的应用。通过声源—滤波器模型介绍解卷积的重要性，阐述同态解卷积的基本原理和符号定义，并分析声源激励信号和声道冲激响应在倒谱域的特性，为后续的MFCC参数提取奠定基础。

摘要由CSDN通过智能技术生成

为了深入理解MFCC,也就是梅尔倒谱系数，这个博文想要做的就是理解什么是倒谱，为什么要进行倒谱。至于如何具体的求解倒谱在这里并没有真正提到，只是大概提了一点思路。下一步会着手从人耳的的生理构造开始，理解梅尔频率是如何定义出来的，以及后人如何对它进行不断修正。再接下来就是看如何提取语音的MFCC参数，最终达到理解每一个提取步骤及其做设计的数学算法。

MFCC研究（一）之语音信号的同态解卷积

一、背景：

①在声源—滤波器的声学模型中，我们将语音信号可以看成是由激励信号和声道响应卷积所产生的。而在语音信号处理的各个领域中，通过语音信号求得声门的激励信号和声道冲激响应这两种信号也有着非常重要的意义。因此我们现在要完成的任务就是将这两种信号从一个语音信号中分离出来。

②“解卷积”就是意味着要将这两种卷积分量分开。解卷的算法总共有两大类，一类算法称为“参数解卷”，即线性预测分析，另一类算法称为“非参数解卷”，即同态解卷积。而现在我们要解决当前任务的方法就是同态解卷积。

二、符号定义：

$x(n)$ ：采样后的语音信号，已经离散化。

$e\left( n\right)$ ：离散的声门激励信号

$v\left( n\right)$ ：离散的声道冲激响应

$D^{\ast }$ ：特征系统，将时域上的语音信号转化为倒谱域上的语音信号

$D^{\ast -1}$ ：逆特征系统，将倒谱域上的语音信号转化为时域上的语音信号

$L\left( \cdot \right)$ ：在倒谱域上对信号进行处理，常见的处理方式是将声源信号和声道信号进行分离

$\widehat {x}\left( n\right)$ ：倒谱域上的语音信号【注：凡是信号上面有尖角标注的均为倒谱域上的信号，其余就不一一列举】

三、基本框图：

同态解卷积整体系统框图（图1.1）

主要任务部分：特征系统 $D^{\ast }$ 的系统框图（图1.2）

逆特征系统 $D^{\ast -1}$ 的系统框图（图1.3）

四、基本原理解释：

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。