为了深入理解MFCC,也就是梅尔倒谱系数,这个博文想要做的就是理解什么是倒谱,为什么要进行倒谱。至于如何具体的求解倒谱在这里并没有真正提到,只是大概提了一点思路。下一步会着手从人耳的的生理构造开始,理解梅尔频率是如何定义出来的,以及后人如何对它进行不断修正。再接下来就是看如何提取语音的MFCC参数,最终达到理解每一个提取步骤及其做设计的数学算法。
MFCC研究(一)之语音信号的同态解卷积
一、背景:
①在声源—滤波器的声学模型中,我们将语音信号可以看成是由激励信号和声道响应卷积所产生的。而在语音信号处理的各个领域中,通过语音信号求得声门的激励信号和声道冲激响应这两种信号也有着非常重要的意义。因此我们现在要完成的任务就是将这两种信号从一个语音信号中分离出来。
②“解卷积”就是意味着要将这两种卷积分量分开。解卷的算法总共有两大类,一类算法称为“参数解卷”,即线性预测分析,另一类算法称为“非参数解卷”,即同态解卷积。而现在我们要解决当前任务的方法就是同态解卷积。
二、符号定义:
:采样后的语音信号,已经离散化。
:离散的声门激励信号
:离散的声道冲激响应
:特征系统,将时域上的语音信号转化为倒谱域上的语音信号
:逆特征系统,将倒谱域上的语音信号转化为时域上的语音信号
:在倒谱域上对信号进行处理,常见的处理方式是将声源信号和声道信号进行分离
:倒谱域上的语音信号【注:凡是信号上面有尖角标注的均为倒谱域上的信号,其余就不一一列举】
三、基本框图:
同态解卷积整体系统框图(图1.1)
主要任务部分:特征系统的系统框图(图1.2)
逆特征系统的系统框图(图1.3)
四、基本原理解释: