高清语音HD Voice(HIGH DefinitionVoice)
当一提到HD VOICE高清语音时,第一时间想到的就是VOLTE,语音速率/带宽。其实再WCDMA等制式上,国外早已开始使用HD VOICE。
一般来说,HD VOICE指的是AMR_WB,而AMR_WB(宽带自适应语音编码)是相对AMR_NB(窄带自适应编码)来说的。
AMR-NB和AMR-WB这2种编码具有如下特点:
l 每20ms产生一个语音包,包括了RTP/UDP/RLC-Security压缩头;
l 每160ms生成一个SID语音静默包。
l 帧长20ms;
AMR-NB编码特点为:
l 4.75kbps到12.2kbps共8个码率,分别为:4.75、5.15、5.9、6.7、7.4、7.95、10.2、12.2kbps;
l 采样率为8kHz。
AMR-WB编码特点为:
l 6.6kbps到23.85kbps共8个码率,分别为:6.6、8.85、12.65、14.25、15.85、18.25、19.85、23.05、23.85kbps;
l 采样率为16kHz。
可见两者显著的差异是采样速率不一样,窄带一个语音帧是160个点,宽带一个语音帧采样320个点。AMRNB的语音带宽范围:300-3400Hz,8KHz采样。AMRWB的语音带宽范围: 50-7000Hz,16KHz采样。用户可主观感受到话音比以前更加自然、舒适和易于分辨。
AMR WB与AMR NB不同之处在于AMR WB按16kHz采样,分别按频率带50~6400Hz 和6400~7000Hz 进行编码。用来降低复杂度,AMR WB将位算法集中到更重要的频率区。低频带使用ACELP算法进行编码。 添加几个特征来达到一个高的主观质量。线性预测(LP)算法是在每隔20ms 的帧要进行一次线性预测算法,每5ms搜索一次自适应码本,这个过程是在12.8Kbs 速率下进行。高频带是在解码器端使用低带和随机激励的参数重建的, 目的是调整与在声音基础上的低频有关的高频带. 高频带的声频通过使用由低带LP 过滤器产生的LP 滤波器进行重建。
参考文档:
1.VoLTE维护优化丛书-汇总-5.0v10
2. ITU G.722.1 is alicensed royalty-free ITU-Tstandard audiocodec providinghigh quality,moderate bitrate (24 and 32kbit/s) wideband (50 Hz –7 kHz audio bandwidth, 16 ksps(kilo-samples per second) audio coding. It is a partial implementationof Siren 7 audiocoding format (which offers bit rates 16, 24,32 kbit/s) developed by PictureTel Corp.(now Polycom, Inc.).[1][2] Its official nameis Low-complexity coding at 24 and32 kbit/s for hands-free operation in systems withlow frame loss.