小白入门音视频第三天

本文介绍了音频的基本概念,包括声音的频率、振幅和波形,详细阐述了数字音频的采样、量化和编码过程,以及音频帧的概念。同时讨论了比特率、文件大小和常见的音频格式如WAV、MP3、WMA和AAC的特性与优势。
摘要由CSDN通过智能技术生成

1.音频的基本概念

声音有三要素,分别是频率、振幅、波形。

  • 1)频率:声波的频率,即声音的音调,一般女生发出声音的音调高于男生,人类听觉的频率(音调)范围为20Hz--20000Hz
  • 2)振幅:即声波的响度,通俗的讲就是声音的高低,一般男生的声音振幅(响度)大于女生。
  • 3)波形:即声音的音色,同样的频率和振幅下,钢琴和小提琴的声音听起来完全不同的,因为他们的音色不同。波形决定了其所代表声音的音色。音色不同是因为它们的介质所产生的波形不同。

2.数字音频

  • 1)采样:在时间轴上对信号数字化。
  • 2)量化:在幅度轴上对信号数字化。

  • 3)编码:按一定格式记录采样和量化后的数字数据。通常所说的音频裸数据格式就是脉冲编码调制(PCM)数据。描述一段 PCM 数据通常需要以下几个概念:量化格式(位深,通常 16bit)、采样率声道数

3.音频帧

对于视频来说,视频每一帧就是一个图像,而音频是没有帧的概念的,但是人们可以规定音频帧的概念,例如AAC规定23.22ms的音频为一帧,MP3规定26.08ms的音频为一帧。根据网上的资料音频帧播放时长公式为:(帧大小 / 采样率)x 1000 单位ms

4.音频相关计算

  1. 比特率(码率):采样率  x 采样位数 x 声道数
  2. 文件大小:采样率 x 录音时间 x 采样位数 / 8 x 通道数。 

5.常见的音频格式

  1. WAV:WAV是最常见的声音文件格式之一,是微软公司专门为Windows开发的一种标准数字音频文件,该文件能记录各种单声道或立体声的声音信息,并能保证声音不失真。但WAV文件有一个致命的缺点,就是它所占用的磁盘空间太大(每分钟的音乐大约需要12兆磁盘空间)。
  2. MP3: MP3 全称是 MPEG-1 Audio Layer 3,它在 1992 年合并至 MPEG 规范中。MP3 能够以高音质、低采样率对数字音频文件进行压缩。应用最普遍。
  3. WMA:WMA (Windows Media Audio)是微软在互联网音频、视频领域的力作。WMA 格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18。此外,WMA 还可以通过 DRM(Digital Rights Management)保护版权。
  4. AAC: AAC 实际上是高级音频编码的缩写。AAC 是由 Fraunhofer IIS-A、杜比和 AT&T 共同开发的一种音频格式,它是 MPEG-2 规范的一部分。AAC 所采用的运算法则与 MP3 的运算法则有所不同,AAC 通过结合其他的功能 来提高编码效率。AAC 的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如 MP3 等)。它还同时支持多达 48 个音轨、15 个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC 可以在比 MP3 文件缩小 30%的前提下提供更好的音质。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

深蔚蓝i

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值