音频编码基础知识

最新推荐文章于 2024-07-28 12:50:15 发布

VectorAL

最新推荐文章于 2024-07-28 12:50:15 发布

阅读量1k

点赞数 1

分类专栏：音视频开发基础文章标签：音频编码解码

本文链接：https://blog.csdn.net/sjp1992/article/details/108638330

版权

音视频开发基础专栏收录该内容

17 篇文章 8 订阅

订阅专栏

音频编码基础

1.音频压缩技术

音频有损压缩：在保证音频不失真的前提下，对音频数据进行尽可能大的压缩。
压缩的主要方法是消除音频中的冗余信息，包括人耳听觉范围外的音频以及被遮蔽掉的音频信号，分为频域遮蔽和时域遮蔽。
在这里插入图片描述

音频无损压缩：
无损压缩编码方式：熵编码，包括哈夫曼编码，算术编码，香农编码

使用音频压缩技术的原因：
一个PCM音频流的码率=采样率值×采样大小值×声道数。假设一个采样率为44.1KHz，采样大小为16bit，双声道的PCM编码的音频文件，它的码率则为 44.1K×16×2 =1411.2 Kbps。注意这边的单位是小b，单位是位。如果我们将单位转换为字节，则需要将码率除以8，就可以得到这个WAV的数据速率，即176.4KB/s。这表示存储一秒钟采样率为44.1KHz，采样大小为16bit，双声道的PCM编码的音频信号，需要176.4KB的空间，1分钟则约为10.34M，这对大部分用户是不可接受的，要降低磁盘占用，只有2种方法，降低采样指标或者压缩。降低指标是不可取的，因此专家们研发了各种压缩方案。