ffmpeg 音频开发（1）：基础知识

最新推荐文章于 2024-06-22 11:46:14 发布

安卓兼职framework应用工程师

最新推荐文章于 2024-06-22 11:46:14 发布

阅读量488

点赞数 2

分类专栏： ffmpeg 文章标签： ffmpeg 音频基础知识

本文链接：https://blog.csdn.net/baidu_41666295/article/details/103169217

版权

本文介绍了音频开发的基础知识，包括音频应用的场景，如播放器、录音和监控等。重点讲解了音频开发中的关键概念：采样率、量化精度和声道数。采样率决定了音频的质量，常见的有44.1kHz、48kHz等；量化精度影响声音质量，常见位宽为8bit和16bit；声道数指声音来源或扬声器数量，如单声道和立体声。此外，还提及了音频帧的概念及其在不同采样率下的播放时长，以及常见的音频编码和压缩格式，如PCM、MP3、AAC等。

摘要由CSDN通过智能技术生成

导读

人的说话频率基本上为300Hz3400Hz，但是人耳朵听觉频率基本上为20Hz20000Hz。

对于人类的语音信号而言，实际处理一般经过以下步骤：

人嘴说话——>声电转换——>抽样（模数转换）——>量化（将数字信号用适当的数值表示）——>编码（数据压缩）——>

传输（网络或者其他方式）

——> 解码（数据还原）——>反抽样（数模转换）——>电声转换——>人耳听声。

抽样率

实际中，人发出的声音信号为模拟信号，想要在实际中处理必须为数字信号，即采用抽样、量化、编码的处理方案。

处理的第一步为抽样，即模数转换。

简单地说就是通过波形采样的方法记录1秒钟长度的声音，需要多少个数据。

根据奈魁斯特（NYQUIST）采样定理，用两倍于一个正弦波的频繁率进行采样就能完全真实地还原该波形。

所以，对于声音信号而言，要想对离散信号进行还原，必须将抽样频率定为40KHz以上。实际中，一般定为44.1KHz。

44.1KHz采样率的声音就是要花费44000个数据来描述1秒钟的声音波形。

原则上采样率越高，声音的质量越好，采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级。

22.05 KHz只能达到FM广播的声音品质，44.1KHz则是理论上的CD音质界限，48KHz则已达到DVD音质了。

码率

对于音频信号而言，实际上必须进行编码。在这里，编码指信源编码，即数据压缩。如果，未经过数据压缩，直接量化进行传输则被称为PCM（脉冲编码调制）。
要算一个PCM音频流的码率是一件很轻松的事情，采样率

最低0.47元/天解锁文章

安卓兼职framework应用工程师

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
ffmpeg 音频开发（1）：基础知识

导读人的说话频率基本上为300Hz3400Hz，但是人耳朵听觉频率基本上为20Hz20000Hz。对于人类的语音信号而言，实际处理一般经过以下步骤：人嘴说话——>声电转换——>抽样（模数转换）——>量化（将数字信号用适当的数值表示）——>编码（数据压缩）——>传输（网络或者其他方式）——> 解码（数据还原）——>反抽样（数模转换）——&gt...
复制链接

扫一扫