音频编码基础知识

音频编码基础

1.音频压缩技术

音频有损压缩:在保证音频不失真的前提下,对音频数据进行尽可能大的压缩。
压缩的主要方法是消除音频中的冗余信息,包括人耳听觉范围外的音频以及被遮蔽掉的音频信号,分为频域遮蔽和时域遮蔽。
在这里插入图片描述
在这里插入图片描述
音频无损压缩:
无损压缩编码方式:熵编码,包括哈夫曼编码,算术编码,香农编码

使用音频压缩技术的原因:
一个PCM音频流的码率=采样率值×采样大小值×声道数。假设一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频文件,它的码率则为 44.1K×16×2 =1411.2 Kbps。注意这边的单位是小b,单位是位。如果我们将单位转换为字节,则需要将码率除以8,就可以得到这个WAV的数据速率,即176.4KB/s。这表示存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M,这对大部分用户是不可接受的,要降低磁盘占用,只有2种方法,降低采样指标或者压缩。降低指标是不可取的,因此专家们研发了各种压缩方案。

2.音频编码过程

在这里插入图片描述
时域转频域变化
时域是描述数学函数或物理信号对时间的关系。
在研究时域的信号时,常会用示波器将信号转换为其时域的波形
频域是指在对函数或信号进行分析时,分析其和频率有关部份,而不是和时间有关的部份
有兴趣的可以去了解一下傅里叶变换

心理声学原理
心理声学原理是指用功能强大的算法将我们听不到的音频信息去掉。
20hz-20000hz之间的,才是人能听到的。之外的可以称为冗余数据。
冗余数据还有被遮蔽掉的数据,分为频域遮蔽和时域遮蔽。

量化编码
通常也把音频采样过程叫脉冲编码调制编码,即PCM(Pulse Code Modulation)编码,采样值也叫PCM值。
PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。

参考文章

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

VectorAL

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值