一、音视频常见术语
- 容器:一种文件格式,比如flv,mkv等,包含5种流以及文件头信息
- 流:一种视频数据信息的传输方式,有5种流:音频:Audio Stream、附件:t、数据:d、字幕:s和视频:Video Stream
- 帧:代表一幅静止的图像,分为I帧,P帧,B帧。I 帧的体积特别大,当运动矢量不是特别大的时候,P帧不会太大,B帧参考前后帧
- 编解码器:是对视频进行压缩或者解压缩,CODEC = COde 编码 + DECode 解码
- 码流:指视频图像经过编码压缩后在单位时间内的数据流量,也叫码率,单位是kb/s或者Mb/s。同样分辨率下,压缩比越小,视频图像的码率就越大,画面质量就越高,文件体积也越大。计算公式:文件体积 = 时间 X 码率 / 8
- 采样率:也称为采样频率,定义了每秒从连续的模拟信号中提取并组成离散信号的采样个数,用赫兹(Hz)表示,采样率越高,还原后的音质、画质就越好
- 比特率:指每秒传送的比特(bit)数,单位为bps,比特率越高,传送的数据越大。比特率越高,音视频的质量就越好,但编码后的文件就越大。计算公式:比特率 = 采样率 x 采样位数 x 声道数
二、封装格式
作用: 视频码流和音频码流按照一定的格式储存在一个文件,例如下载的视频,来源不同,这些文件有不同的格式,用不同的后缀拓展名表示:avi,rmvb,mp4,flv,mkv
注意:格式代表的是封装格式,不代表具体使用了什么视音频编码标准
2.1 封装格式介绍
名称 | 推出机构 | 目前使用领域 |
---|---|---|
AVI | Microsoft Inc | BT下载影视 |
MP4 | MPEG | 互联网视频网站 |
TS | MPEG | IPTV,数字电视 |
FLV | Adobe Inc | 互联网视频网站 |
MKV | CoreCodec Inc. | 互联网视频网站 |
RMVB | Real Networks Inc | BT下载影视 |
视频编码: 将视频像素数据(RGB,YUV)压缩成为视频码流,从而降低视频的数据量
音频编码: 将音频采样数据(PCM)压缩成为音频码流,从而降低音频的数据量
视频像素:保存了屏幕上每一个像素点的像素值格式,常见的有RGB24,RGB32,YUV420P,YUV422P,YUV444P
音频采样数据:保存音频中每个采样点的值,数据体积很大
2.2 视频编码介绍
名称 | 推出机构 | 推出时间 |
---|---|---|
HEVC(H.265) | MPEG/ITU-T | 2013 |
H.264 | MPEG/ITU-T | 2003 |
MPEG4 | MPEG | 2001 |
MPEG2 | MPEG | 1994 |
VP9 | 2013 | |
VP8 | 2008 | |
VC-1 | Microsoft Inc | 2006 |
2.3 音频编码介绍
名称 | 推出机构 | 推出时间 |
---|---|---|
AAC | MPEG | 1997 |
AC-3 | Dolby Inc | 1992 |
MP3 | MPEG | 1993 |
WMA | Microsoft Inc | 1999 |
三、音视频数据
3.1 视频编码数据
将视频像素数据(RGB,YUV等)压缩成为视频码流,从而降低视频的数据量
3.2 音频编码数据
将音频采样数据(PCM等)压缩成为音频码流,从而降低音频的数据量
3.3 视频像素数据
保存了屏幕上每一个像素点的像素值,常见的像素数据格式有RGB24,RGB32,YUV420P,YUV422P,YUV444P等。压缩编码中一般使用的是YUV格式的像素数据,最为常见的格式为YUV420P
特点:视频像素数据体积很大,假定帧率为25HZ,取样精度8bit,一小时高清视频的RGB24格式的数据体积为:3600 * 25 * 1920 * 1080 * 3 = 559.9 GB
3.4 音频采样数据
保存了音频中每个采样点的值.音频采样数据体积很大,假定采样率为44100Hz,采样精度为16bit,一首4分钟的PCM格式的歌曲体积为:
4 * 60 * 44100 * 2 * 2 = 42.3 MByte