音频基础知识

本文介绍了音频的基础知识,包括声音的三要素、PCM和WAV格式、量化基本概念以及WAV Header。详细讲解了音频处理流程,特别是直播客户端的处理,如音频采集、编码和解码。还探讨了音频压缩,尤其是有损压缩中的音频冗余信息,并重点讨论了AAC编码器,包括AAC规格和格式。最后,阐述了音频重采样的重要性、步骤以及关键API。
摘要由CSDN通过智能技术生成

声音的三要素

  • 音调:音频的快慢,频率越高音调越高
  • 音色:谐波
  • 音量:振动的幅度,幅度越大,音量越大

PCM和WAV

音频原始数据格式

  • PCM:纯音频数据,没有任何音频格式
  • WAV:存储原始数据或压缩数据,在PCM文件前加一个头,包含了一些基本信息

量化基本概念

  • 采样大小:一个采样用多少bit存放。常用的是16bit,能够表述的数值的最大范围值。
  • 采样率:采样频率 8k、16k、32k、44.1k、48k,
  • 声道数:单声道(1)、双声道(2)、多声道(立体声)
  • PCM音频流码流 = 采样大小 * 采样率 * 声道数

WAV Header

WAV Header 格式

  • Num Channels :声道数
  • Sample Rate :采样率
  • BitsPerSample :采样大小,2字节 = 16位(bit)
  • ByteRate :采样率字节数,ByteRate = BitsPerSample/8 * Sample Rate * Num Channels
    WAV格式例子

音频处理流程

直播客户端的处理流程

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值