ffmpeg 音频开发(1):基础知识

本文介绍了音频开发的基础知识,包括音频应用的场景,如播放器、录音和监控等。重点讲解了音频开发中的关键概念:采样率、量化精度和声道数。采样率决定了音频的质量,常见的有44.1kHz、48kHz等;量化精度影响声音质量,常见位宽为8bit和16bit;声道数指声音来源或扬声器数量,如单声道和立体声。此外,还提及了音频帧的概念及其在不同采样率下的播放时长,以及常见的音频编码和压缩格式,如PCM、MP3、AAC等。
摘要由CSDN通过智能技术生成

导读

人的说话频率基本上为300Hz3400Hz,但是人耳朵听觉频率基本上为20Hz20000Hz。

对于人类的语音信号而言,实际处理一般经过以下步骤:

人嘴说话——>声电转换——>抽样(模数转换)——>量化(将数字信号用适当的数值表示)——>编码(数据压缩)——>

传输(网络或者其他方式)

——> 解码(数据还原)——>反抽样(数模转换)——>电声转换——>人耳听声。

抽样率

实际中,人发出的声音信号为模拟信号,想要在实际中处理必须为数字信号,即采用抽样、量化、编码的处理方案。

处理的第一步为抽样,即模数转换。

简单地说就是通过波形采样的方法记录1秒钟长度的声音,需要多少个数据。

根据奈魁斯特(NYQUIST)采样定理,用两倍于一个正弦波的频繁率进行采样就能完全真实地还原该波形。

所以,对于声音信号而言,要想对离散信号进行还原,必须将抽样频率定为40KHz以上。实际中,一般定为44.1KHz。

44.1KHz采样率的声音就是要花费44000个数据来描述1秒钟的声音波形。

原则上采样率越高,声音的质量越好,采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级。

22.05 KHz只能达到FM广播的声音品质,44.1KHz则是理论上的CD音质界限,48KHz则已达到DVD音质了。

码率

对于音频信号而言,实际上必须进行编码。在这里,编码指信源编码,即数据压缩。如果,未经过数据压缩,直接量化进行传输则被称为PCM(脉冲编码调制)。
要算一个PCM音频流的码率是一件很轻松的事情,采样率
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

安卓兼职framework应用工程师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值