语音的线性预测系数(Linear Prediction Coefficient,LPC)

线性预测技术很早(1967年)就已经被应用与语音处理领域,基本概念是:一个语音的采样值可以通过过去若干语音采样值的线性组合来逼近(最小均方误差),能够决定唯一的一组预测系数,而这个预测系数就是题目中的LPC,可以当作是该语音的一个特征。

1.优势

线性预测最重要的优势在于其可以较为精确的估计语音的参数,而这些极少的参数可以正确的表现语音信号的时域和频域特性。

2.基本原理

线性预测分析的基本原理是把信号用一个模型来表示,即将信号看作某一个模型(系统)的输出,这样就可以用该模型的参数来描述信号。

假设模型的输入为u(n),输出为x(n),模型传递函数为H(z),则求模型的参数则可用传递函数的方法来求解,即:
传递函数:频域方程

对应到时域:
时域关系
上式是一个线性常系数差分方程,表示模型的输出是由模型过去的输入u(n-l)、当前的输入u(n)和过去输入x(n-i)的线性组合。当模型参数确定后就可以用模型过去的输入以及过去的信号值来估计当前的信号值。
而为了方便求解,我们对模型进行了简化,采用了自回归模型:当前输出=当前输入+过去输出进行线性组合:
自回归模型

3.求解方法

由于上面已经得到了模型的差分方程,接下来我们就是想如何求解这个方程,考虑使用下面的现行预测器来估计:
这里写图片描述
其中x^是原始信号x的估计值,是由过去的p个输出线性组合而成,其中ai即为线性预测系数(LPC)。所以我们只要保证预测信号与原始信号误差(最小均方误差)最小,来求解出系数ai即可。
经过对误差函数的一系列变形我们可以得到:
这里写图片描述 ……………..(a)
其中这里写图片描述

所以只要求出这里写图片描述,就可解出系数ai。

又由自相关的定义,我们可以得到
这里写图片描述
所以可以联想到这里写图片描述可以得出:
这里写图片描述
所以(a)式可以化为
这里写图片描述
因为r(j)可以求出,则上式中求解ai即为求解线性方程组,
求解方法Levinson-Durbin法:
这里写图片描述
重复上述步骤即可得到系数这里写图片描述
至此,即求出了语音信号的p阶LPC特征。

文中很多公式、思想来自于北航出版社宋知用老师编著的《MATLAB在语音分析与合成中的应用》,十分感谢。

  • 6
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值