G711算法的公式和曲线

最新推荐文章于 2023-07-17 22:04:23 发布

smith24122412

最新推荐文章于 2023-07-17 22:04:23 发布

阅读量981

点赞数

G711压扩算法

G711算法采用8kHz采样率，有A-law和μ-law两种压扩方式，分别是将13bit和14bit编码为8bit，因此G711固定码率是8kHz*8bit=64kbps。两者都是对数变换，A-law更加方便计算机处理。μ-law提供了略微高一些的动态范围，但代价是对于弱信号的量化误差相对A-law高一些。两者均采用对数变换的原因也正是由于人耳对于声音的感知不是线性变化而是对数型变化的特性。

下面分别介绍两种算法。

A-law的公式如下，一般采用A=87.6

画出图来则是如下图，用x表示输入的采样值，F(x)表示通过A-law变换后的采样值，y是对F(x)进行量化后的采样值。

由此可见在输入的x为高值的时候，F(x)的变化是缓慢的，有较大范围的x对应的F(x)最终被量化为同一个y，精度较低。相反在低声强区域，也就是x为低值的时候，F(x)的变化很剧烈，有较少的不同x对应的F(x)被量化为同一个y。意思就是说在声音比较小的区域，精度较高，便于区分，而声音比较大的区域，精度不是那么高。

μ-law的公式如下，μ取值一般为255

和A-law画在同一个坐标轴中就能发现A-law在低强度信号下，精度要稍微高一些。

以上是两种算法的连续条件下的计算公式，实际应用中，我们确实可以用浮点数计算的方式把F(x)结果计算出来，然后进行量化，但是这样一来计算量会比较大，实际上对于A-law（A=87.6时），是采用13折线近似的方式来计算的，而μ-law（μ=255时）则是15段折线近似的方式。

A-law如下表计算，第一列是采样点，共13bit，最高位为符号位。对于前两行，折线斜率均为1/2，跟负半段的相应区域位于同一段折线上，对于3到8行，斜率分别是1/4到1/128，共6段折线，加上负半段对应的6段折线，总共13段折线，这就是所谓的A-law十三段折线法

对应的解码公式则是

网上有G711的源码，我们可以从中学到一些东西。

复制代码

 1 #define    SIGN_BIT    (0x80)        /* Sign bit for a A-law byte. */
 2 #define    QUANT_MASK    (0xf)        /* Quantization field mask. */
 3 #define    NSEGS        (8)            /* Number of A-law segments. */
 4 #define    SEG_SHIFT    (4)            /* Left shift for segment number. */
 5 #define    SEG_MASK    (0x70)        /* Segment field mask. */
 6 #define    BIAS        (0x84)        /* Bias for linear code. */
 7 
 8 static const int16_t seg_uend[8] = { 0xFF, 0x1FF, 0x3FF, 0x7FF, 0xFFF, 0x1FFF, 0x3FFF, 0x7FFF };
 9 static const int16_t seg_aend[8] = { 0x1F, 0x3F, 0x7F, 0xFF, 0x1FF, 0x3FF, 0x7FF, 0xFFF };;
10 
11 static int16_t search(int16_t val, const int16_t *table, int16_t    size)
12 {
13     int    i;
14 
15     for (i = 0; i < size; i++) {
16         if (val <= *table++)
17             return (i);
18     }
19     return (size);
20 }
21 
22 static uint8_t linear2alaw(int16_t pcm_val) /* 2's complement (16-bit range) */
23 {
24     int16_t  mask;
25     int16_t  seg;
26     uint8_t  aval;
27 
28     pcm_val = pcm_val >> 3;//这里右移3位，因为采样值是16bit，而A-law是13bit数据，存储在高13位上，低3位被舍弃
29 
30     if (pcm_val >= 0) {
31         mask = 0xD5;//二进制的11010101
32     }
33     else {
34         mask = 0x55;//二进制的01010101，与0xD5只有符号位的不同
35         pcm_val = -pcm_val - 1;//负数转换为正数计算
36     }
37 
38     seg = search(pcm_val, seg_aend, 8);//查找采样值对应哪一段折线
39 
40     if (seg >= 8) {
41         return (uint8_t)(0x7F);//越界时直接返回最大值
42     }
43     else {
44         //以下按照表格处理，低4位是数据，5~7位是指数，最高位是符号
45         aval = (uint8_t)seg << SEG_SHIFT;
46         if (seg < 2)
47             aval |= (pcm_val >> 1) & QUANT_MASK;
48         else
49             aval |= (pcm_val >> seg) & QUANT_MASK;
50 
51         return (aval);
52     }
53 }

复制代码

跟算法相关的部分我已经在注释中说明了，这里令人困惑的一点是mask的作用，为此我把输入x从-32768~32767范围内的所有输出值对应标在坐标格上（图一左半边应该是在0坐标以下，为表示方便取了其绝对值）