g723源码详细分析-14-感知加权滤波器补充

在分析解码后置滤波器时
重找了一些感知加权的资料

补充一些对共振峰感知加权的理解

先来看感知加权滤波器的系统函数(itu 723文档中的式11)

10
1 - Σ a[j] * (z * γ1)^(-j)
j=1
W(z) = ------------------------------
10
1 - Σ a[j] * (z * γ2)^(-j)
j=1

这个形式可能让人迷惑,笔者做一个改造
A(z/γ1)
W(z)= -----------
A(z/γ2)

10
其中 A(z)= 1 - Σ a[j] * (z)^(-j)
j=1

输入是y[n] 残差x[n] 冲激响应h[n]
对应的z变换 y(z) x(z) h(z)
1
h(z) = --------
A(z)

可以看出,h(e^jw)也就是h(z)在单位圆上的取值,会出现10个峰起,也就是共振峰(峰起点实际就是h(z)=0时的根)
这里涉及到人的听觉心理,即人对声音信号的感知,共振峰处的能量贡献较大.
为了增强语音效果,自然希望增强共振峰频域附近的声音能量.

把A(z)改造成多因式乘积的形式
A(z) = (a1*(z^-1)+b1)(a2*(z^-1)+b2)...(a10*(z^-1)+b10)

1
h(z) = ---------------------------------------------------
(a1*(z^-1)+b1)(a2*(z^-1)+b2)...(a10*(z^-1)+b10)

将A(z/γ2)代入
1
h(z/γ2) = -------------------------------------------------------
(γ2a1*(z^-1)+b1)(γ2a2*(z^-1)+b2)...(γ2a10*(z^-1)+b10)

我们来看第一项 (γ2a1*(z^-1)+b1),它在单位圆上的取值特点,会是这样

| y轴 _
| | |
| / \
|______| |_____________
|____________________________x轴

即,大多数情况下,值很小,然后会有一个峰起,是h(z)共振峰中的第一个
显然,此γ2就起到了加强共振峰的作用,对非共振峰频域,加强的效果就很小,
对其它因子(如(γ2a2*(z^-1)+b2))的加强,也很小,但影响还是有的,所以会有后置滤波这一说.

而分子γ1,则是对γ2的一个调节.
我们先假设γ1=1,

y(z) 1
h(z) = ------ = -------
x(z) A(z)

y(z) * W(z) = y(z) * A(z) * A(z/γ2)
而y(z) * A(z) = x(z)

x(z)* A(z/γ2) 相当于,用残差去激励了一个共振峰加强的声道系统,就会起到增加音质的作用

那么γ1不等于1的情况,则是起调节γ2作用,简单地说,看下式

γ1 * x + 1
-----------
γ2 * x + 1

γ1自然能调试γ2的影响

g723于是出现了开头对信号的预处理,以此来加强共振峰





评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值