音频相关名词
- **VAD(Voice Activity Detection)语音动态侦测
- CNG(Comfort Noise Generation)舒适背景音处理
- PLC(Packet Loss Concealment)语音封包遗失补偿
- QoS(Quality of Service)有效语音频宽管理
- RTP(Real-Time Transport Protocol)实时传输协
- DTMF(Dual Tone Multi Frequency),双音多频
- AGC Automatic Gain Control自动增益控制;
- Ns Automatic Gain Control自动增益控制;
- AEC/Aecm 回声抵消
enum VADActivity {
kVadActive = 0,
kVadPassive = 1,
kVadUnknown = 2
};
enum SpeechType {
kNormalSpeech = 0,
kPLC = 1,
kCNG = 2,
kPLCCNG = 3,
kUndefined = 4
};
webrtc 的回声抵消(aec、aecm)算法主要包括以下几个重要模块:
1.回声时延估计
2.NLMS(归一化最小均方自适应算法)
3.NLP(非线性滤波)
4.CNG(舒适噪声产生)
双音多频,由高频群和**低频群组成,高低频群各包含4个频率。一个高频信号和一个低频信号叠加组成一个组合信号,代表一个数字。DTMF信令有16个编码。利用DTMF信令可选择呼叫相应的对讲机
双音多频信号(DTMF),电话系统中电话机与交换机之间的一种用户信令,通常用于发送被叫号码。
在使用双音多频信号之前,电话系统中使用一连串的断续脉冲来传送被叫号码,称为脉冲拨号。脉冲拨号需要电信局中的操作员手工完成长途接续。
双音多频信号是贝尔实验室发明的,其目的是为了自动完成长途呼叫。
双音多频的拨号键盘是4×4的矩阵,每一行代表一个低频,每一列代表一个高频。每按一个键就发送一个高频和低频的正弦信号组合,比如’1’相当于697和1209赫兹(Hz)。交换机可以解码这些频率组合并确定所对应的按键。
下表描述了每个DTMF信号的频率。
1209 Hz | 1336 Hz | 1477 Hz | 1633 Hz | |
---|---|---|---|---|
697 Hz | 1 | 2 | 3 | A |
770 Hz | 4 | 5 | 6 | B |
852 Hz | 7 | 8 | 9 | C |
941 Hz | * | 0 | # | D |