CONTENT:
* AMR简介
* AMR 话音质量评定
* AMR 文件结构解析
* AMR 帧结构解析
* AMR 帧读取算法
* AMR 解码原理及流程
* AMR 模式选择自适应机制
一、AMR 简介
基于新的网络和新的要求,无论是从节省传输频带资源,还是保持线路通信的高效率等方面来看,研究采用各种可变速率语音编码技术的系统都有重要意义。目前为了适应此需要提出了AMR(Adaptive Multi-rate) 的概念,即自适应多速率语音编码器,主要用于移动设备的音频,压缩比比较大,但相对其他的压缩格式质量比较差,由于多用于人声通话。AMR又分为两种,一种是AMR-NB(AMR-NarrowBind),语音带宽范围:300-3700Hz,8KHz采样频率;另外一种是AMR-WB(AMR WideBand),语音带宽范围50-7000Hz,16KHz采样频率。但考虑语音的短时相关性,每帧长度均为20ms。这两种编码器根据带宽的要求虽然选用了不同的速率,但有异曲同工之处.
(1)AMR-NB
AMR的采样频率为8KHz,每20ms编码一帧,每个帧中包含160个语音样点。
AMR采用的是基于代数码激励线性预测(ACELP)的编码模式,编码端提取ACELP模型参数(线性预测系数,自适应码本和固定码本索引及增益),解码端接收到数据然后根据这些参数从新合成语音。
TD-SCDMA中AMR-NB的实现。此编码器运用了代数码本线性预测(ACELP)混合编码方式,也就是数字语音信号中既包括若干语音特征参数又包括部分波形编码信息,再运用这些特征信息重新合成语音信号的过程。控制这些参数的提取数目,根据速率要求对信息进行取舍而得到了以下8种速率,混合组成如表一所示的自适应语音编码器。如模式AMR_12.20就提取出244比特的参数信息,而模式AMR_4.70却只提取了95比特信息。根据这些比特所含的信息量可以将其分为3类比特class 0,1和2。在信道编码时class 0和1都将会使用循环冗余校验码进行差错检验,对于class 2则根据上一帧进行恢复。
表一 : AMR 编码器的编码速率
编码模型 |
编码器的比特速率 |
编码模型 |
编码器的比特速率 |
AMR_12.2 |
12,20kbit/s(GSM_EFR) |
AMR_5.90 |
5,90 kbit/s
|
AMR AMR |
10,20 kbit/s |
AMR_5.15 |
5,15 kbit/s |
AMR_7.95 |
7,95 kbit/s |
AMR_4.75 |
4,75 kbit/s |
AMR_7.40 |
7,40kbit/s (IS-641) |
AMR_SID |
1,80 kbit/s (无语音信息传输) |
AMR_6.70 |
6,70kbit/s (PDC-EFR) |
|
|
包括低速率的背景噪声编码模式(DTX)1.80kb/s
( 2)AMR-WB
AMR-WB”全称为“Adaptive Multi-rate – Wideband”,即“自适应多速率宽带编码”,采样频率为
16kHz,是一种同时被国际标准化组织ITU-T和3GPP采用的宽带语音编码标准,也称为G722.2标准。
AMR-WB 支持9种不同的编码方式:6.6kb/s 8.85kb/s 12.65kb/s 14.25kb/s 15.85kb/s
18.25kb/s 19.85kb/s ,23.05kb/s,23.85kb/s,提供的语音带宽范围达到50~7000Hz,人声感觉比以前
更加自然、舒适和易于分辨 。
二、话音质量评定
语音编码或语音压缩编码研究的基本问题,就是在给定编码速率的条件下,如何能得到尽量好的