视频是由一系列图像帧(frames)组成的。H264是一种视频压缩技术,它通过减小视频文件的大小,使视频更容易的传输和存储。
编码过程主要有以下几个方法:
1.视频分块(Video Partitioning):
把视频分成很小的块,这样每个快可以独立的被处理。
2.运动估计(Motion Estimation(艾死忒mation))
H264会观察视频中的物体,然后计算它们在连续帧之间的运动。这个信息被用来描述物体的位置随着时间的变化。
3.变换和量化(Transform and Quantization)
对视频中的每个小块进行数学转换,把像素值变成一组数字。然后,这些数字被精简,以便更好的储存。
4.熵编码(Entropy(嗯戳皮) Coding)
对转换后的数字进行编码,以便更有效的表示数据。就像把一本厚书编成一个简洁的小册子,以便更容易携带。
5.帧内预测(Intra Prediction)
预测一个视频帧内的像素值,减少需要存储的信息量。
6.帧间预测(Inter Prediction)
预测一个帧相对于其他帧的位置,以减小储存需求。如果一个物体在两帧之间只是稍微移动了一点,H.264会只储存这个小移动,而不是整个物体的所有信息。
7.熵编码和打包(Entropy Coding and Packing)
把所有的信息编码成一个小的文件,以便传输或储存。
综合使用这些技术,H.264能够在保持视频质量的同时,显著地减小文件大小,使视频能够更容易地通过互联网传输,也更容易地被储存在设备上