AGC:自动增益控制(Automatic Gain Control)
使放大电路的增益自动地随信号强度而调整的自动控制方法。
自动增益控制是限幅输出的一种,它利用线性放大和压缩放大的有效组合对助昕器的输出信号进行调整。当弱信号输入时,线性放大电路工作,保证输出信号的强度;当输入信号达到一定强度时,启动压缩放大电路,使输出幅度降低。AEC:声学回声消除(Acoustic Echo Cancelling)
是透过音波干扰方式消除麦克风与喇叭因空气产生回受路径(feedback path)而产生的杂音。
在电话上,如果延迟是相当明显(多于几百毫秒),它被认为是恼人的。ANS:自动噪声消除(Automatic Noise Suppression)
可探测出背景固定频率的杂音并消除背景噪音NetEQ:
NetEQ模块是Webrtc语音引擎中的核心模块
NetEQ模块基本上分为:自适应缓冲器(Adaptive Packet Buffer),语音解码器(Speech Decoder),抖动控制和丢包隐藏(Jitter Control and Error Concealment) 以及播放(Play Out)四大部分。其中抖动控制和丢包隐藏模块是NetEQ的核心算法,既控制着自适应缓冲器,又与解码器进行紧密的交互,并且将最终的计算结果交给声卡去播放。VAD:静音抑制(Voice Activity Detection)
语音活动检测(Voice Activity Detection,VAD)又称语音端点检测,语音边界检测。目的是从声音信号流里识别和消除长时间的静音期,以达到在不降低业务质量的情况下节省
话路资源的作用,它是IP电话应用的重要组成部分。静音抑制可以节省宝贵的
带宽资源,可以有利于减少用户感觉到的端到端的时延。WebRTC
WebRTC是一项在浏览器内部进行实时视频和音频通信的技术
WebRTC实现了基于网页的视频会议,标准是WHATWG 协议,目的是通过浏览器提供简单的javascript就可以达到实时通讯(Real-Time Communications (RTC))能力。WebRTC提供了视频会议的核心技术,包括音视频的采集、编解码、网络传输、显示等功能,并且还支持跨平台:windows,linux,mac,android。
WebRTC由语音引擎,视频引擎和网络传输三大模块组成,其中语音引擎是WebRTC中最具价值的技术之一。jitter buffer:抖动缓冲器
在voice over IP(VoIP)中,抖动缓冲器是一个共享的数据区域,在这个数据区域中,每隔一段均匀的间隔,语音包会被收集,存储并发到语音处理器。包到达时间的变化,称作抖动,将会由于网络拥塞,定时漂移或路由变更而产生。抖动缓冲器放于语音连接的接收端,它有意地延迟到达的包,如此一来,终端用户就会感受到一个清晰的,没有什么声音失真的连接。抖动缓冲器有两种,静态的和动态的。静态抖动缓冲器是基于硬件的,它是由厂家来配置的。而动态抖动缓冲器是基于软件的,它由网管配置以适应网络延迟的改变。CNG:舒适噪音生成(Comfort Noise Generator)
是一个在通话过程中出现短暂静音时用来为电话通信产生背景噪声的程序。
是VoIP技术中静音抑制(silence suppression)或语音活动检测(VAD)的一部分。语音引擎的一般工作流程如下:
- 发起端进行声音采集
- 采集到的声音信号进行回声消除,噪音抑制,自动增益控制处理
- 语音压缩编码
- 通过Internet网路传输到接收端
- 到达接收端,先进入NetEQ模块进行抖动消除,丢包隐藏解码等操作
- 将处理过后的音频数据送入声卡设备进行播放
语音专用名词
最新推荐文章于 2022-07-19 11:24:56 发布