【windows】音频的基本概念

最新推荐文章于 2024-05-17 16:46:32 发布

musali

最新推荐文章于 2024-05-17 16:46:32 发布

阅读量656

点赞数

分类专栏： windows

本文链接：https://blog.csdn.net/musali/article/details/103541813

版权

windows 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

声音简介：

声音相关：

1.音调：也就是频率，频率越高，那么音调也就越高。

2. 音量：振幅，振幅越高，那么音量就越高。

3. 音色：与材质有关，不规则的正弦波。

二、音频

1. 采样率：

采样率，简单来说就是每秒获取声音样本的次数。声音是一种能量波，其具有音频频率和振幅的特征。那么采样的过程，其实就是抽取某点的频率值。那么，如果我们在一秒钟抽取的点越多，获得的信息也就越多; 采样率越高，声音的质量就越好。但是并不是说采样率越高就越好了，因为人耳听觉的范围为20Hz ~ 20kHz。一般来讲，44100HZ 的采样率已经能够满足基本的要求了。

2.采样数

采样数跟采样率和时间有关系，比如采样率为44100Hz，采样时间为1s，那么1s内的采样数就为44100个。

3. 采样位数

采样位数也叫采样大小或者量化位数。量化深度表示每个采样点用多少比特表示，音频的量化深度一般为8、16、32位等。例如：量化深度为8bit时，每个采样点可以表示256个不同的量化值，而量化深度为16bit时，每个采样点可以表示65536个不同的量化值。量化深度的大小影响到声音的质量，显然，位数越多，量化后的波形越接近原始波形，声音的质量越高，而需要的存储空间也越多；位数越少，声音的质量越低，需要的存储空间越少。CD音质采用的是16 bits。

4. 通道数：

即声音的通道数目，常见的有单声道和双声道或者立体声道。

单声道的声音只能使用一个扬声器发声，或者也可以处理成两个扬声器输出同一个声道的声音，当通过两个扬声器回放单声道信息的时候，我们可以明显感觉到声音是从两个音箱中间传递到我们耳朵里的，无法判断声源的具体位置。

双声道就是有两个声音通道，其原理是人们听到声音时可以根据左耳和右耳对声音相位差来判断声源的具体位置。声音在录制过程中被分配到两个独立的声道，从而达到了很好的声音定位效果。

记录声音时，如果每次生成一个声波数据，称为单声道；每次生成两个声波数据，称为双声道（立体声）。立体声（双声道）存储大小是单声道文件的两倍。

5. 音频帧：

音频跟视频不太一样，视频的每一帧就是一副图像，但是因为音频是流式的，本身是没有一帧的概念的。而且有些时候确实没有办法说一帧怎么怎么样。比如对于PCM流来说，采样率为44100Hz，采样位数为16，通道数为2，那么一秒的音频固定大小的：44100*16*2 / 8字节。但是人们可以规定一帧的概念，比如amr帧比较简单，它规定每20ms的音频是一帧。

6. 比特率（码率）

指音频每秒钟播放的数据量，单位为bit，例如对于PCM流，采样率为44100Hz，采样大小为16，声道数为2，那么码率为：44100* 16 * 2 = 1411200 bps。

7. 关于音频文件大小的计算：

文件大小 = 采样率 * 录音时间 * 采样位数 / 8 * 通道数。

8. PCM流

简单说下PCM流，后面也会详细介绍PCM流，PCM流就是原始收录声音时，数据会保存到一串buffer中，这串buffer，就采用了PCM格式存储的。在windows中，通过WaveIn 或者CoreAudio 采集声音，得到的原始数据就是一串PCM格式的buffer。后面会详细说明PCM流。

musali

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【windows】音频的基本概念

声音简介：声音相关：1.音调：也就是频率，频率越高，那么音调也就越高。2. 音量：振幅，振幅越高，那么音量就越高。3. 音色：与材质有关，不规则的正弦波。二、音频1. 采样率：采样率，简单来说就是每秒获取声音样本的次数。声音是一种能量波，其具有音频频率和振幅的特征。那么采样的过程，其实就是抽取某点的频率值。那么，如果我们在一秒钟抽取的点越多，获得的信息也就越多...
复制链接

扫一扫

专栏目录