走进5G时代的音视频开发

最新推荐文章于 2024-04-09 02:28:02 发布

Linux高级开发

最新推荐文章于 2024-04-09 02:28:02 发布

阅读量1.6k

点赞数 3

分类专栏： IT

本文链接：https://blog.csdn.net/qq_42302962/article/details/103440286

版权

音频的基础知识

1采样和采样频率：

现在是数字时代，在音频处理时要先把音频的模拟信号变成数字信号，这叫A/D转换。要把音频的模拟信号变成数字信号，就需要采样。一秒钟内采样的次数称为采样频率

2采样位数/位宽：

数字信号是用0和1来表示的。采样位数就是采样值用多少位0和1来表示，也叫采样精度，用的位数越多就越接近真实声音。如用8位表示，采样值取值范围就是-128 ~ 127，如用16位表示，采样值取值范围就是-32768 ~ 32767。

3声道（channel）：

通常语音只用一个声道。而对于音乐来说，既可以是单声道（mono），也可以是双声道（即左声道右声道，叫立体声stereo），还可以是多声道，叫环绕立体声

4编解码：

通常把音频采样过程也叫做脉冲编码调制编码，即PCM（Pulse Code Modulation）编码，采样值也叫PCM值。如果把采样值直接保存或者发送，会占用很大的存储空间。以16kHz采样率16位采样位数单声道为例，一秒钟就有16/8*16000 = 32000字节。为了节省保存空间或者发送流量，会对PCM值压缩。

目前主要有三大技术标准组织制定压缩标准：

1.ITU，主要制定有线语音的压缩标准（g系列），有g711/g722/g726/g729等。

2.3GPP,主要制定无线语音的压缩标准（amr系列等）,有amr-nb/amr-wb。后来ITU吸纳了amr-wb，形成了g722.2。

3.MPEG,主要制定音乐的压缩标准，有11172-3，13818-3/7，14496-3等。

一些大公司或者组织也制定压缩标准，比如iLBC，OPUS。

编码过程：模拟信号->抽样->量化->编码->数字信号

5压缩:

对于自然界中的音频信号，如果转换成数字信号，进行音频编码，那么只能无限接近，不可能百分百还原。所以说实际上任何信号转换成数字信号都会“有损”。但是在计算机应用中，能够达到最高保真水平的就是PCM编码。因此，PCM约定俗成了无损编码。我们而习惯性的把MP3列入有损音频编码范畴，是相对PCM编码的。强调编码的相对性的有损和无损

6码率:

码率 = 采样频率 * 采样位数 * 声道个数；例：采样频率44.1KHz，量化位数16bit，立体声(双声道)，未压缩时的码率 = 44.1KHz * 16 * 2 = 1411.2Kbps = 176.4KBps，即每秒要录制的资源大小,理论上码率和质量成正比

800 bps – 能够分辨的语音所需最低码率（需使用专用的FS-1015语音编解码器）

8 kbps —电话质量（使用语音编码）

8-500 kbps --Ogg Vorbis和MPEG1 Player1/2/3中使用的有损音频模式

500 kbps–1.4 Mbps —44.1KHz的无损音频，解码器为FLAC Audio,WavPack或Monkey's Audio

1411.2 - 2822.4 Kbps —脉冲编码调制(PCM)声音格式CD光碟的数字音频

5644.8 kbps —SACD使用的Direct Stream Digital格式

7常用音频格式

WAV 格式：音质高无损格式体积较大

AAC（Advanced Audio Coding）格式：相对于 mp3，AAC 格式的音质更佳，文件更小，有损压缩，一般

最低0.47元/天解锁文章

Linux高级开发

关注

3
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
走进5G时代的音视频开发

音频的基础知识1采样和采样频率：现在是数字时代，在音频处理时要先把音频的模拟信号变成数字信号，这叫A/D转换。要把音频的模拟信号变成数字信号，就需要采样。一秒钟内采样的次数称为采样频率2采样位数/位宽：数字信号是用0和1来表示的。采样位数就是采样值用多少位0和1来表示，也叫采样精度，用的位数越多就越接近真实声音。如用8位表示，采样值取值范围就是-128 ~ 127，如用16位表示，...
复制链接

扫一扫