一、音频3A技术背景
手机电脑等智能设备的普及,AI智能、5G等技术的不断发展,语音通信成为了最方便快捷的远程交流方式,会议全向麦克风、会议一体化终端等会议系统逐渐成为企业经营中的重要工具。语音质量决定了企业远程沟通协作效果,其中噪音和回声能够严重影响到语音预处理后的质量,从而降低参会人员对另一方语音的接收完整度和准确性。我们知道影响通话质量的主要因素是噪声和回声,其中噪声是语音信号在采集、传输、编码等处理过程中的无用成分,而回声就是在通话过程中从听筒听到自己讲话的声音。噪音和回声的存在令人难以忍受,如何降低噪声及回声对语音信号的影响至关重要,而音频3A算法的产生就是为了解决这些问题。
二、音频3A技术内容
音频3A算法主要包含以下三个方面:
(1).声学回声消除(AEC)
(2).背景噪声抑制(ANS)
(3).自动增益控制(AGC)
音频数据的处理过程有个预处理过程,就是在音频数据采集完成之后的一步,音频的预处理就是用的3A处理。啸叫和回声是因为扬声器发出的声音被麦克风再拾取导致的,所以拥有3A音频算法的设备,会通过算法将回音消除后再输出。
三、音频3A技术算法原理
1、AEC回声消除算法原理
回声消除(AEC)是指在二线传输的两个方向上同时间、同频谱地占用线路,在线路两个方向传输的信号完全混在一起,本端发信号的回波就成为了本端信号的干扰信号,利用自适滤波器可抵消回波以达到较好的接收信号质量,即为回声消除。回声消除的原理就是利用接收到的音频与本地采集的音频做对比,添加反相的人造回声,将远端的声音消除。
2、ANS背景噪声抑制算法原理
背景噪声抑制(ANS)指的是将声音中的背景噪声识别并进行消除的处理。背景噪声分为平衡噪声和瞬时噪声,平稳噪声频谱稳定,瞬时噪声频谱能量方差小,利用噪声的特点,对音频数据添加反向波形处理,即可消除噪声。目前,对于平稳的噪声处理已经有很多种简单方法能够进行成功抑制,但是对于生活中常见的一些瞬态噪声却没有过多解决的好办法。
瞬态噪声的共同特点就是突发性极强,在时域上呈振荡衰弱的形式出现,持续时间在十几毫秒至上百毫秒不等,在频域上分布很宽,所以在频域上瞬态噪声的频谱基本上都是和正常的语音的频谱混叠在一起的很难进行抑制。
3、AGC自动增益算法原理
自动增益控制(AGC)指当直放站工作于最大增益且输出为最大功率时,增加输入信号电平,提高直放站对输出信号电平控制的能力。其主要用于调整音量幅值,提高语音通信系统在带噪声环境中的性能。人正常交谈的音量在40-60dB之间,低于25dB的声音听起来很吃力,而超过100dB的声音会让人感到不适,AGC的作用就是将音量调整到人接受的范围。
音频响度及麦克风拾音控制是保证音视频沟通质量的重要技术手段,一般来说,音频标准、传输条件、人为失误等因素都可能导致音频信号之间出现声音突变或者响度不一致的情况,这时候就需要对音频信号放大或缩小以得到自然清晰的语音通信。