【小知识】音频基础知识

音频基础知识

声音是振动产生的声波,经过空气、固体、液体这些介质传播并被人或动物听觉器官所感知的波动现象。音频信号采集需要将声音通过麦克风等转变为模拟信号,然后对模拟信号进行抽样、量化和编码转换成离散的数字信号。PCM(Pulse Code Modulation)就是一种将模拟信号数字化的方法,一般也用来表示未经过封装的音频原始文件。模数转换过程中涉及三个基本概念:采样位深、采样率和通道数。

采样位深:每个采样点用多少bit表示,该值越大,能够表达振动幅度的精确程度就越高。例如采样位深为16bit,则意味着可以将振动幅度划分为65536个等级。

采样率:每秒的采样点数,一般用 Hz来表示,比如1s如果有48000个采样点,则采样率就是48kHz。因为人耳的听觉范围是20Hz-20KHz,根据奈奎斯特采样定理,模数转换过程中,采样频率大于信号中最高频率的2倍时,采样后的数字信号可以完整地保留原始信号的信息。因此如果采样率为48kHz,可以完整保留24kHz以下频率的完整音频信息。

通道数:声音通道个数,常见的为单通道和双通道。双通道可以理解为单通道数据保存两份。人左右耳因为空间位置导致听到声音时间不同,双通道通过播放时模拟这种情况营造声音从不同方向传来的空间感。

音频采样过程中持续采样时间称为帧长,可以使用20ms,也可以使用200ms,时间越短延时越小。假设一次采样,采样位深是16bit,采样率为16kHz,单通道,帧长为20ms,使用PCM,则每帧的大小为:

帧大小 = 位深 * 采样率 * 帧长 * 通道/ (1000*8)
      = 16 * 16000 * 20 * 1 /(1000*8)
      = 640字节
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值