深度解析G711编解码流程与实现(一）

Crazy learner

于 2024-09-01 12:32:33 发布

阅读量1.2k

点赞数 13

分类专栏：音频基础文章标签： g711 语音识别人工智能

本文链接：https://blog.csdn.net/weixin_52734695/article/details/141782613

版权

音频基础专栏收录该内容

73 篇文章

订阅专栏

G711 编码标准是一种广泛应用于语音压缩的算法，它通过对线性脉冲编码调制 (PCM) 信号进行非线性压缩，实现了语音数据的高效存储和传输。G711 算法主要包含 A 律和 μ 律两种编码方式，两者在国际通信中均有广泛应用。本文将深入探讨 G711 编解码的流程与实现，并提供对其核心代码的详细讲解。

G711 编码基础

G711 标准是 ITU-T 推出的语音编码标准之一，采用对数压缩方式对语音信号进行编码。它的基本思想是通过非线性压缩来减少语音信号的动态范围，从而提高编码效率和抗噪能力。G711 标准定义了两种编码方式：A 律编码（主要用于欧洲和国际通信）和 μ 律编码（主要用于北美和日本）。这两种编码方式在实际应用中有着各自的特点和优势。

1. A 律编码
A 律编码的压缩过程通过对较大的振幅信号进行较强的压缩，而对较小的振幅信号进行较弱的压缩，以提高语音信号的动态范围。这种方式在信号处理过程中引入了一定的量化误差，但在主观听觉上这种误差通常是可以接受的。

2. μ 律编码
μ 律编码的压缩方式与 A 律类似，但它采用了不同的压缩曲线。相比 A 律编码，μ 律编码在低振幅信号的压缩精度上更高，因而在某些情况下能提供更好的信噪比。然而，它在处理大振幅信号时的压缩效率相对较低。

G711 编解码实现

G711 的实现涉及线性 PCM 信号与 A 律/μ 律编码之间的转换，这个过程可以分为以下几个步骤：

线性 PCM 到 A 律/μ 律的编码：通过对线性 PCM 信号进行压缩，将其转换为 8 位的 A 律或 μ 律编码。
A 律/μ 律到线性 PCM 的解码：将 A 律或 μ 律编码的数据恢复为原始的 16 位线性 PCM 信号。
以下是核心代码的详细讲解，包含了 g711.h、g711.c 和 g711_table.c 文件中的关键实现。

1. g711.h 文件解析
g711.h 文件定义了用于 G711 编码和解码的函数接口。这些函数包括将线性 PCM 转换为 A 律和 μ 律编码，以及将 A 律和 μ 律编码转换为线性 PCM 的操作。

unsigned char linear2alaw(short pcm_val);
short alaw2linear(unsigned char a_val);
unsigned char linear2ulaw(short pcm_val);
short ulaw2linear(unsigned char u_val);
unsigned char alaw2ulaw(unsigned char aval);
unsigned char ulaw2alaw(unsigned char uval);

这些函数的输入和输出参数类型非常直观，输入的 pcm_val 是 16 位线性 PCM 信号，函数返回值为 8 位的 A 律或 μ 律编码。

2. g711.c 文件解析
g711.c 文件实现了 G711 编码与解码的核心算法。其主要逻辑如下：

a. 线性 PCM 到 A 律的转换

unsigned char linear2alaw(short pcm_val)
{
    short mask;
    short seg;
    unsigned char aval;

    pcm_val = pcm_val >> 3;  // 缩小PCM值的范围

    if (pcm_val >= 0) {
        mask = 0xD5;  // 符号位(第7位)为1
    } else {
        mask = 0x55;  // 符号位为0
        pcm_val = -pcm_val - 1;  // 如果是负数，取其绝对值并减1
    }

    seg = search(pcm_val, seg_aend, 8);  // 查找段号

    if (seg >= 8) {  // 超出范围返回最大值
        return (unsigned char)(0x7F ^ mask);
    } else {
        aval = (unsigned char)seg << SEG_SHIFT;
        if (seg < 2) {
            aval |= (pcm_val >> 1) & QUANT_MASK;
        } else {
            aval |= (pcm_val >> seg) & QUANT_MASK;
        }
        return (aval ^ mask);
    }
}

这段代码通过压缩 PCM 信号将其转换为 A 律编码。首先，PCM 信号被右移三位以缩小其范围，然后根据信号的符号确定符号位。接着，函数根据 PCM 信号的大小确定其所属的段，并利用该段和量化位进行编码，最后返回压缩后的 A 律编码。

b. A 律到线性 PCM 的转换

short alaw2linear(unsigned char a_val)
{
    short t;
    short seg;

    a_val ^= 0x55;  // 与 0x55 异或以去除编码偏移

    t = (a_val & QUANT_MASK) << 4;  // 提取量化位并左移
    seg = ((unsigned)a_val & SEG_MASK) >> SEG_SHIFT;  // 提取段号

    switch (seg) {
    case 0:
        t += 8;  // 段号为 0
        break;
    case 1:
        t += 0x108;  // 段号为 1
        break;
    default:
        t += 0x108;
        t <<= seg - 1;  // 其他段号左移
    }

    return ((a_val & SIGN_BIT) ? t : -t);  // 根据符号位确定输出正负
}

这段代码实现了 A 律编码到线性 PCM 信号的转换。它首先通过异或操作去除 A 律编码中的偏移，然后根据段号和量化位计算恢复后的 PCM 信号值，最后根据符号位确定 PCM 信号的正负。

3. g711_table.c 文件解析
g711_table.c 文件扩展了编码和解码的功能，通过查找表加速了编码和解码的过程。这些查找表在初始化时通过调用相应的函数进行填充。

a. 查找表的初始化

void pcm16_alaw_tableinit()
{
    build_linear_to_xlaw_table(linear_to_alaw, linear2alaw);
}

void pcm16_ulaw_tableinit()
{
    build_linear_to_xlaw_table(linear_to_ulaw, linear2ulaw);
}

void alaw_pcm16_tableinit()
{
    build_xlaw_to_linear_table(alaw_to_linear, alaw2linear);
}

void ulaw_pcm16_tableinit()
{
    build_xlaw_to_linear_table(ulaw_to_linear, ulaw2linear);
}

这些初始化函数创建了从线性 PCM 到 A 律或 μ 律的编码查找表，以及从 A 律或 μ 律到线性 PCM 的解码查找表。这些查找表的构建极大地提高了编码和解码的速度。

b. 查找表的使用

void pcm16_to_alaw(int src_length, const char *src_samples, char *dst_samples)
{
    pcm16_to_xlaw(linear_to_alaw, src_length, src_samples, dst_samples);
}

void alaw_to_pcm16(int src_length, const char *src_samples, char *dst_samples)
{
    xlaw_to_pcm16(alaw_to_linear, src_length, src_samples, dst_samples);
}

这些函数利用查找表加速了从 PCM 到 A 律或 μ 律的编码，以及从 A 律或 μ 律到 PCM 的解码。它们通过查找表快速找到对应的编码值，从而避免了复杂的实时计算。

4. 主函数详解
g711_table.c 文件中的主函数展示了如何使用上述编码和解码功能。它首先从文件中读取 PCM 数据，然后根据用户指定的编码模式对其进行相应的处理，最后将处理后的数据写回文件。

int main(int argc, char *argv[])
{
    FILE *fRead, *fWrite;
    char *bufferRead, *bufferWrite;
    long bufferReadSize, bufferWriteSize;
    size_t readed;
    encode_mode mode = A_LAW_TO_PCM;

    // 打开文件并读取数据
    err = fopen_s(&fRead, "D:\\vssssssssssssssssss\\G711\\sample\\g711-encoded.pcm", "rb");
    bufferReadSize = get_file_size(fRead);
    bufferRead = allocate_buffer(bufferReadSize);
    readed = fread(bufferRead, sizeof(char), bufferReadSize, fRead);
    fclose(fRead);

    // 根据模式进行编码或解码
    if (mode == A_LAW_TO_PCM) {
        alaw_pcm16_tableinit();
        bufferWriteSize = bufferReadSize * 2;
        bufferWrite = allocate_buffer(bufferWriteSize);
        alaw_to_pcm16(bufferReadSize, bufferRead, bufferWrite);
    } else if (mode == PCM_TO_A_LAW) {
        pcm16_alaw_tableinit();
        bufferWriteSize = bufferReadSize / 2;
        bufferWrite = allocate_buffer(bufferWriteSize);
        pcm16_to_alaw(bufferReadSize, bufferRead, bufferWrite);
    }

    // 将结果写入文件
    err = fopen_s(&fWrite, "D:\\vssssssssssssssssss\\G711\\sample\\g711-decoded.pcm", "wb");
    fwrite(bufferWrite, sizeof(char), bufferWriteSize, fWrite);
    fclose(fWrite);

    free(bufferWrite);
    free(bufferRead);

    return 0;
}

在此过程中，主函数利用查找表对数据进行了高效的编码和解码操作。整个过程充分展示了 G711 编解码的核心思想和实现方法。