ALC AGC DRC-容易混淆的音频前端算法


音频前端距离模拟端最近的数字信号是需要动态改变幅值的,输出端即希望饱满的声音,有担心幅值大引起失真,所以DRC就必不可少,简单的可以用limiter来处理;采集端希望捕获的信号能在最佳表达区间,所以agc就需要了,如果没有真实的模拟gain控制,也可称为alc-自动电平控制(这么解释也很牵强,两者的表达的控制主体不一样,实质是一回事),即对采集的信号进行数字增益控制。

DRC-线性压缩还是对数压缩

drc的概念就不赘述了,只是有一个有趣的问题这里提一下,在stanfold的一篇教学课件中有一张典型的DRC原理图:
在这里插入图片描述
这张图中基本介绍了DRC要做的事情和几个关键的参数,观察坐标可以看出这是基于电压即线性空间的动态压缩。然而在另一篇Digital Dynamic Range Compressor Design—A Tutorial and Analysis专著中,介绍的是对数域的方法,引用其中的一张图如下:
在这里插入图片描述
那么哪个更好呢?粗略的比较了两文,觉得对数域更符合人类听觉感知,而时域上对实时计算有很大的优势。

ALC AGC

alc( agc)比drc要复杂,主要用于音频的采集通路,下图是一个简单的alc算法,可以将输入端很低的信号动态放大到合适的范围,但令人苦恼的是alc深受噪声和语音激活状态的影响,三个方法的波形都将最后的非稳态噪声显著的放大了,第二个方法采用了包络检测,由于粗略的估计,致使很多音频没有被放大,声音听上去很难接受。
在这里插入图片描述

WebRtc中的agc

初涉agc才发现为什么能和ans、aec并称为3A算法,原理虽然不复杂,但能调整出稳定舒服的agc信号,是不容易的。为此,我们学习一下WebRtc中legacy的agc方法,窥见一下此A的奥妙之处。
在这里插入图片描述

WebRtcAgc的vad

从上图中可以看到有三处调用WebRtcAgc_ProcessVad的地方,两处检测近端,一处检测远端。

  1. 近端都是从AnalyzeCaptureAudio开始的调用vad检测,这个是归属LegacyAgc结构里的vadMic,这个vad是为了AnalogProcess过程服务的,他将通过WebRtc_SpeakerInactiveCtrl更新vadThreshold,然后在WebRtcAgc_ProcessAnalog的最后根据vad评估结果设置不同的mic电平。
  2. 近端从ProcessCaptureAudio一路调用的vad,这个归属LegacyAgc结构里的子结构体DigitalAgc中的vadNearend,既是为数字agc的近端服务的。
  3. 远端是评估对讲端有可能产生回声的情况,但这个回声反馈延时需要在工程实施的时候自己tuning,否则如何保证远端叠加到近端的是哪一段?

在这里插入图片描述WebRtcAgc_AddMic在调用vad之前,做了三件事:

  1. 如果micVol比模拟最大的增益还大,意味着信号很小,所以根据MaxAnolog,Maxlevel增益的设定,对信号做最大10db的放大;
  2. 计算10个子帧(1ms)的最大10个能量,作为信号包络;
  3. 归一化(16k采样率降到8k,32k采样率采用低8k)合并10个子帧(1ms)到5个子帧(2ms)的block能量,作为信号强度指示;
    然后利用in_Mic的数据进行vad估计,因为直接对mic数据进行vad估计,所以噪声和回声都是比较敏感的。

WebRtcAgc_VirtualMic是自适应数字通道,对WebRtcAgc_AddMic又做了一层封装,可以理解为虚拟的音量调节。

WebRtcAgc要控制什么

kAgcModeFixedDigital

这个控制顾名思义,就是按照固定的gain来调整输入信号的电平,但VAD是一样的流程。纵向的观察,核心内容就如下面的流程,关键是要读懂GainTable的生成,以及DigitalGain的计算,这是没有自动(自适应)以及反馈给模拟增益的环路的。这可以理解为带与设定增益的输入DRC,因为会有limiter,所以不会担心溢出。

在这里插入图片描述

kAgcModeAdaptiveAnalog&&kAgcModeAdaptiveDigital

WebRtcAgc_Analyze在调用WebRtcAgc_ComputeDigitalGains之后,会调用WebRtcAgc_ProcessAnalog,然后WebRtcAgc_Process就是直接调用WebRtcAgc_ApplyDigitalGains,可见WebRtcAgc_ProcessAnalog是关键的评估自动调整增益的缓解。下图是kAgcModeAdaptiveDigital场景下,最大三种gain调整的流程,可见webrtc对agc的控制是很严谨的。
在这里插入图片描述

参考文档

Dynamic Range Processing and Digital Effects
Digital Dynamic Range Compressor Design—A Tutorial and Analysis
FabFilter Pro-C 2 online hel
Advanced Audio and Video Development — Lesson 3: Automatic Gain Control (AGC)
Advanced Audio and Video Development — Lesson 2: Acoustic Echo Cancellation
breakway audio
an all-digital implementation of an AGC
Automatic Gain Control Algorithms for Wireless Sensors
详解 WebRTC 高音质低延时的背后 — AGC(自动增益控制)
Webrtc AGC 算法原理介绍(一)
WEBRTC AGC 算法原理初识(二)
Webrtc AGC 算法原理初识(一)
WebRTC AGC 流程解析
Webrtc AGC 算法原理介绍(一)
Webrtc AGC 算法原理介绍(二)
Webrtc AGC 算法原理介绍(三)
Webrtc AGC 算法原理介绍(四)
Webrtc AGC 算法原理介绍(五)
Webrtc AGC 算法原理介绍(六)
深入浅出 WebRTC AEC(声学回声消除)
Automatic Gain Control
CNG算法原理分析
史上最全的dB分贝单位合集: dB,dBFS, dB FS, dBTP, dB TP, dBO, dBov, dBu/dBv, dBV, dBm/dBmW, dBW,…
WebRTC中AGC模块分析(上)
WebRTC VAD模块分析

  • 7
    点赞
  • 32
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值