matlab实现cqt频谱,LPCC、MFCC和CQCC简介及matlab实现

本文介绍了LPC、LPCC、MFCC和CQT/CQCC等音频特征提取方法。LPC通过线性预测系数分析语音信号,LPCC是其在倒谱中的表示。MFCC考虑了人耳听觉特性,适用于语音识别。CQT是一种音乐识别中的频谱转换,CQCC则在CQT基础上用于语音识别。文章提供各方法的基本原理并讨论其优缺点,但MATLAB实现未详述。
摘要由CSDN通过智能技术生成

一、LPC和LPCC

1、LPC

假设:当前信号的值x(n),可以用过去p个取样值的加权和s(n)^来预测

其中,s(n)^为预测值,s(n)为真实值, 加权系数a1、a2、a3…ai称为p阶线性预测系数。

LPC分析:对于预测误差滤波器而言,求其预测系数a1、a2、a3…ai,使得预测误差e(n)在某种预测条件下最小的过程。

A(z)称为LPC误差滤波器,用于求p阶参数。

ea090a19ebc9cae6f284c4ae3f19dc78.png

最小准则:常用的是均方误差E[e(n)^2]最小。

2、语音信号模型与LPC之间的关系

语音信号产生过程:声门激励u(n),声道调制h(n)。

声道系统函数:H(z)=S(z)/U(z)是线性预测合成滤波器,用于重建语音

21276796655ca8af4af66fec0d260694.png

结论:声道系统函数H(z)可以通过线性预测进行表示,即LPC可以反映声道的参数。(当p足够大的时候,该H(z)模型可以模拟所有语音信号的声道系统。)

3、LPCC

本质:声道可以进行线性假设

原因

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值