首先声明,写这个博客只是记录我的理解且仅限于我的理解,不一定正确,假设有错误的地方请指正.
参考文章:
PCM音频振幅知识_pcm 振幅-CSDN博客https://blog.csdn.net/laikaikai/article/details/99823268
声音的概念:
声音是由物体振动产生的压力波,这些波在空气或其他介质中传播。声音波通过改变气压在介质中传播,从而被我们的耳朵感知。
声音的复杂波形可以看作是多个正弦波的叠加,正弦波是分析和理解声音的基础;这一点是傅里叶分析的核心原理。
正弦波的解释:
看下图,正弦波有正负值,这个正负值是基于静态空气压力(常规的大气压:101325帕斯卡(Pa))来设置的。
- 正值:表示声波中空气压力的相对增加。这个阶段的声音压力高于静态空气压力。
- 负值:表示声波中空气压力的相对减少。这个阶段的声音压力低于静态空气压力。
虽然说负值是声音压力低于静态空气压力,但是这不意味着正值的声音的强度就比负值的大;
正负值并不代表声音的大小,是声音压力的振幅决定了声音的强度或音量;
- 声波的振幅:在声波中,振幅代表了声音波的压力变化的大小。声音的振幅越大,声音的响度就越高。声音波的振幅是从静态空气压力(也称为常规空气压力)到声波的峰值(或谷值)的距离。振幅是绝对值。
音频的采样深度:
对于这一部分我有点疑问,下列的解释都是搜索网上的
-
8 位:动态范围=20×log10(2的8次方)=20×2.408≈48.2dB
-
16 位:动态范围=20×log10(2的16次方)=20×4.815≈96.3dB
-
24 位:动态范围=20×log10(2的24次方)=20×7.224≈144.5dB
正弦波有正负值,有符号16位的范围是-32,768 到 32,767,那动态范围不应该是=20×log10(2的15次方)=20×4.515≈90.3dB吗?为什么是96.3dB
我的理解是,如果正弦波的数值是-30000,振幅取绝对值30000表示;所以无符号不区分声音压力高于还是低于静态空气压力,只将表示振幅;对于有符号的不仅区分声音压力高于还是低于静态空气压力还表示振幅值。
但是如果WAV音频文件文件中存储的是无符号的,那我在画波形图的时候该如何画正负值,不懂,不懂