Web音视频入门系列——音视频基础知识

本文介绍了Web音视频开发的基础知识,包括音频的采样率、比特率(码率)和常见编码格式,如MP3、AAC、WAV、FLAC,以及视频的逐行扫描、分辨率、帧率、视频格式和编码格式如VP8/VP9、H.264/H.265。通过深入理解这些概念,有助于开发者更好地制作、存储和传输音视频内容。
摘要由CSDN通过智能技术生成

前言

21世纪以来,随着网络基础设施的不断完善,3G、4G、乃至现今5G网络的普及,互联网彻底改变了我们的生活。以前在家里看一部电影需要买DVD和播放机,现在直接打开浏览器,进各大视频网站就可以看了,而且有非常丰富的视频资源供你选择。与此同时也涌现了许许多多的应用场景:远程会议、远程医疗、在线教育等等。许多开发者也纷纷开始在Web平台上开发自己的音视频应用。为此我想来分享一系列和Web端开发音视频相关的内容,和大家共同学习。本章我会分享一些音视频的基础知识,水平有限,欢迎大家指出错误或者提建议哦!

音频

人耳能听到的声音我们都可以称之为音频,我们经常会用这个词去形容录制好可播放的一段声音。下面我会介绍一些与音频相关的重要概念。包括采样率、比特率(码率)和常见的音频编码。这些是我们在制作、存储、和传输音频所必须了解的内容。

采样率

采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数叫作采样周期或采样时间,它是采样之间的时间间隔。注意不要将采样率与比特率(bit rate,亦称“位速率”)相混淆。(取自维基百科)

通俗来讲,采样率的大小对我们听一个音频最直观的影响就是”清晰度“或者说音频的”还原程度“。理论上录制时的采样率越高,能描述的声波频率就越接近原声,更能还原声音原本的样子,听感上更接近临场听这个声音。但是人耳一般能辨别的采样率也有上限,采样率达到人耳能分辨的阈值后,再高的采样率人耳也难以听出其中的差别。

一般情况下录音设备决定了一个音频采样率的上限。生活中,打电话和播放一首高清音乐就能体现出采样率的不同,我们明显能听出来高清音乐更加的”清晰“,更好的还原出声音,这是因为电话麦克风采样率一般为8000赫兹左右,而一首音乐是在专业的录音棚中由专门的录音设备录制,采样率通常是数万赫兹。

比特率(码率)

比特率,又称码率,我们先看看wiki上对比特率的解释:

比特率是单位时间播放连续的媒体如压缩后的音频或视频的比特数量。在这个意义上讲,它相当于术语数字带宽消耗量,或吞吐量。
比特率规定使用“比特每秒”(bit/s或bps)为单位,经常和国际单位制词头关联在一起,如“千”(kbit/s或kbps),“兆”(百万)(Mbit/s或Mbps),“吉”(Gbit/s或Gbps)和“太”(Tbit/s或Tbps)。
虽然经常作为“速度”的参考,比特率并不测量“‘距离’/时间”,而是被传输或者被处理的“‘二进制码数量’/时间”,所以应该把它和传播速度区分开来,传播速度依赖于传输的介质并且有通常的物理意义。(取自维基百科)

维基上的解释已经非常清楚了。比特率与音频文件占用的存储空间成正比,比特率越高,代表这个音频每秒包含数据量越大,通常也表示这个音频更清晰,音质更好。

不考虑外部因素,一段音频的音质会与采样率和比特率有着直接关系,但是一味的追求较高的采样率和比特率也会带来存储空间和带宽的浪费。所以在录制音频时,我们需要结合实际情况,根据应用场景选择合适的比特率和采样率,这样才能在满足需求的同时降低成本。

音频编码

音频编码就是指将获取到的音频数据按约定格式进行转换。编码时通常会对数据进行一定程度上的压缩,也因此分为2类:有损格式和无损格式。不同的压缩算法,对数据的处理方式也不同。有些编码方式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值