

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

个人主页:董哥聊技术
我是董哥,嵌入式领域新星创作者
创作理念:专注分享高质量嵌入式文章,让大家读有所得!

文章目录
1、前言
现实生活中,我们听到的声音都是时间连续的,我们称为这种信号叫模拟信号。模拟信号需要进行数字化以后才能在计算机中使用。
目前我们在计算机上进行音频播放都需要依赖于音频文件。那么音频文件如何生成的呢?
音频文件的生成过程是将声音信息采样、量化和编码产生的数字信号的过程,我们人耳所能听到的声音频率范围为(20Hz~20KHz),因此音频文件格式的最大带宽是20KHZ。
根据奈奎斯特的理论,音频文件的采样率一般在40~50KHZ之间。
奈奎斯特采样定律,又称香农采样定律,即:为了不失真地恢复模拟信号,采样频率应该大于等于模拟信号频谱中最高频率的2倍。
2、概念
声音的本质是一种能量波,由振动而产生的能量波,通过传输介质传输出去。

声音有三个属性:
- 音调:声音频率的高低,表示人的听觉分辨一个声音的调子高低的程度。音调主要由声音的频率决定,同时也与声音强度有关。
- 音量:由“振幅”(amplitude)和人离声源的距离决定,振幅越大响度越大。
- 音色:又称声音的品质,波形决定了声音的音色。
波长是决定音调高低;振幅是决定音量高低;波纹是决定音色。
3、 PCM介绍
PCM(Pulse Code Modulation),即脉冲编码调制技术。
由于我们人耳听到的声音均为模拟信号,那么我们如何将听到的信息存储起来呢?这就涉及到了PCM技术。
PCM技术就是把声音从模拟信号转化为数字信号的技术,即对声音进行采样、量化的过程,经过PCM处理后的数据,是最原始的音频数据,即未对音频数据进行任何的编码和压缩处理。
4、 PCM原理
脉冲编码调制就是把一个时间连续,取值连续的模拟信号变换成时间离散,取值离散的数字信号后在信道中传输。脉冲编码调制就是对模拟信号先抽样,再对样值幅度量化,编码的过程。
简化来说:PCM脉冲编码调制,以一个固定的频率对模拟信号进行采样,并将采样的信号按照一定精度进行量化,最终量化后的值被输出,记录到存储介质中。
如下图所示:
- 原始模拟音频数据如下:

- 按照固定频率进行采样,得到:

- 最后,对采样后的数据选择合适精度进行量化:

5、PCM相关概念
5.1 采样频率
采样频率:单位时间内对模拟信号的采样次数,它用赫兹(Hz)来表示。采样频率越高,声音的还原就越真实越自然,当然数据量就越大。采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级。
Tip:
5kHz的采样率仅能达到人们讲话的声音质量。11kHz的采样率是播放小段声音的最低标准,是CD音质的四分之一。22kHz采样率的声音可以达到CD音质的一半,目前大多数网站都选用这样的采样率。44kHz的采样率是标准的CD音质,可以达到很好的听觉效果。48KHz:miniDV、数字电视、DVD、电影和专业音频。
5.2 采样位数
采样位数(Sample Bits):又称为采样精度,量化级,也相当于每个采样点所能被表示的数据范围。
采样位数通常有8bits或16bits两种,采样位数越大,所能记录声音的变化度就越细腻,相应的数据量就越大。
8bits为低品质,16bits为高品质,16bits最为常见。
5.3 声道数
声道数(Channels):又称为通道数,指的是:能支持不同发声的音响个数,它是衡量音响设备的重要指标之一。
Tip:
- 单声道的声道数为1个声道;
- 双声道的声道数为2个声道;
- 立体声道的声道数默认为2个声道;
- 立体声道(4声道)的声道数为4个声道。
5.4 音频数据大小计算
知道上面三个概念,我们就能够计算出来一个原始的音频文件所占用空间大小了。
空间大小
(
B
y
t
e
)
=
采样频率
(
h
z
)
∗
时长
(
s
)
∗
采样位数
(
b
i
t
)
∗
声道数
/
8
空间大小(Byte)=采样频率(hz) * 时长(s) * 采样位数(bit)*声道数/8
空间大小(Byte)=采样频率(hz)∗时长(s)∗采样位数(bit)∗声道数/8
5.5 量化
量化: 量化就是通过四舍五入的方法将采样后的模拟信号转换成一种数字信号的过程。
对于采样来说,就是在时间轴上对信号数字化;
对于量化来说,就是在幅度轴上对信号数字化
通过采样时测的的模拟电压值,要进行分级量化,按整个电压变化的最大幅度划分成几个区段,把落在某区段的采样到的样品值归成一类,并给出相应的量化值。



既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
并给出相应的量化值。
[外链图片转存中…(img-cVF2S4cX-1715752806563)]
[外链图片转存中…(img-jyj9pVrK-1715752806563)]
[外链图片转存中…(img-OxTLWu8w-1715752806563)]
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
710

被折叠的 条评论
为什么被折叠?



