PCM音频编码

最新推荐文章于 2025-03-21 05:18:27 发布

Andy____Li

最新推荐文章于 2025-03-21 05:18:27 发布

阅读量2.7w

点赞数 12

分类专栏：音视频文章标签：音视频音频格式

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/m0_37263637/article/details/78914566

版权

音视频专栏收录该内容

17 篇文章

订阅专栏

PCM语音编码

主要过程是将语音等模拟信号每隔一定时间进行取样，使其离散化，同时将抽样值按分层单位四舍五入取整量化，同时将抽样值按一组二进制码来表示抽样脉冲的幅值。也就是说语音信号最终以脉冲形式编码。

有一定电子基础的都知道传感器采集音频信号是模拟量，而我们实际传输过程中使用的是数字量。而这就涉及到模拟转数字的过程，下面将进行介绍。

1 PCM编码原理

PCM 脉冲编码调制是Pulse Code Modulation的缩写。脉冲编码调制是数字通信的编码方式之一。主要过程是将话音、图像等模拟信号每隔一定时间进行取样，使其离散化，同时将抽样值按分层单位四舍五入取整量化，同时将抽样值按一组二进制码来表示抽样脉冲的幅值。

模拟信号数字化必须经过三个过程，即抽样、量化和编码。

1.1抽样

抽样是把模拟信号以其信号带宽2倍以上（来奎斯特采样定理）的频率提取样值（采样率），变为在时间轴上离散的抽样信号的过程。
采样率：每秒从连续信号中提取并组成离散信号的采样个数，用赫兹（Hz）来表示。
sample：
如音频信号采样率为8000hz。
可以理解上图采样对应图中那段电压随时间变化的曲线为1秒那下面那个1 2 3 …10那就因该有1-8000个点，即将1秒均分为8000份，依次取出来那8000个点时间对应的电压值。

1.2 量化

抽样信号虽然是时间轴上离散的信号，但仍然是模拟信号，其样值在一定的取值范围内，可有无限多个值。必须采用“四舍五入”的方法把样值分级“取整”，使一定取值范围内的样值由无限多个值变为有限个值。这一过程称为量化。

采样位数：指的是描述数字信号所使用的位数。
8位(8bit)代表2的8次方=256，16 位(16bit)则代表2的16次方=65536；

sample：
如音频传感器采集到的电压范围为0-3.3V，采样位数为8bit(位)
即我们把3.3V/ 2^8 = 0.0128 即为量化精度。
我们把3.3v分成0.0128为步进的Y轴，如图3中的1 2 …8就变成了0 0.0128 0.0256 ……3.3 V
比如某个采样点的电压值为1.652V(1280.128 与 1290.128之间) 我们对它四舍五入就为1.65V 对应量化等级为128 。

1.3 编码

量化后的抽样信号就转化为按抽样时序排列的一串十进制数字码流，即十进制数字信号。简单高效的数据系统是二进制码系统，因此，应将十进制数字代码变换成二进制编码。根据十进制数字代码的总个数，可以确定所需二进制编码的位数，即字长(采样位数)。这种把量化的抽样信号变换成给定字长的二进制码流的过程称为编码。

sample：
接着上面的1.65V 对应量化等级为128 。对应的2进制为10000000 。即该采样点编码后结果为10000000 。当然这是没有考虑正负值情况下的编码方式，而且编码方式种类非常多，需要具体问题具体分析。（PCM音频格式编码为A律13折线编码）