这两天做一个 H.265 编码测试的功能,编码器需要手动输入 raw yuv frame 的 stride (也可以称作 pitch)数组大小,这个倒是让我一愣,做了这么久的音视频编解码的工作,长时间使用 ffmpeg,或者 x264 的上层接口去封装一个视频帧,竟然对这个该如何赋值给搞不清楚了,这个如果配置不对的话,那么编码出来的视频帧将是花屏的,所以在此还是巩固一下基础知识吧。

stride 可以称之为“跨距”,可以理解为每个 (Y、U、V)每个分量在每一行所占的字节数,这里我们拿 I420 做为例子,我们知道 I420 的数据存储方式为平面存储,即Y、U、V 分开存储,如下图示:

1240

p_w_picpath.png

这样我们可以直观的看出,Y 分量每一行的字节数为图像的宽度 img_width,而由于 U 分量和 V 分量为每两行 Y 像素共享一行 U 和 V 像素,所以 U 和 V 分量在每一行所占的字节数为 图像宽度的一半,即 img_widht / 2,即:

int y_stride = img_width;
int u_stride = img_width / 2;
int v_stride = img_width / 2;

以上计算方式仅适用于 I420 / YUV420P 色彩空间格式的视频帧数据,其它格式请参照 stride 的定义应该就可以很快的确定各个分量的大小了。