音频基础知识

声音的三要素:

频率, 振幅, 波形

频率代表音阶的高低(女生的音阶高,男生偏低), 频率越高,波长就会越短.

振幅代表响度

波形代表音色

 

音频采样:

对模型信号进行采样,采样可以理解为在时间轴上对信号进行数字化

AD转换:

按比声音最高频率高2倍以上的频率对声音进行采样.

采样率:

声音频率为500次,采样1000次,采集顶峰或底峰数据;

前面提到高质量音频信号,其频率范围是20Hz-20KHz.所以采样频率一般是44.1KHzs

 

声音的编码:

按照一定格式记录采样和量化后的数据

音频编码的格式有很多种,而通常所说的音频裸数据指的是脉冲编码调制(PCM)数据.

如果想要描述一份PCM数据,需要从如下几个方向出发:

  • 量化格式(sampleFormat)
  • 采样率(sampleRate)
  • 声道数(channel)

比特率:

以CD音质为例,量化格式为16bite,采样率为44100,声道数为2.这些信息描述CD音质.那么可以CD音质数据,比特率是多少?

44100 * 16 * 2 = 1378.125kbps

 

那么一分钟的,这类CD音质数据需要占用多少存储空间?

1378.125 * 60 / 8 / 1024 = 10.09MB

 

如果sampleFormat更加精确或者sampleRate更加密集,那么所占的存储空间就会越大,同时能够描述的声音细节就会更加精确

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值