使用 8 位 YUV 格式的视频呈现_8bitzenmefasong yuv422-CSDN博客

原文章网址 https://msdn.microsoft.com/zh-cn/library/ms867704.aspx

本文讲述的格式全部使用每个像素位置 8 位的方式来编码 Y 频道（也称为灯光频道），并使用每样例 8 位的方式来编码每个 U 或 V 色度样例。但是，大多数 YUV 格式平均使用的每像素位数都少于 24 位，这是因为它们包含的 U 和 V 样例比 Y 样例要少。本文不讲述带有 10 位和 12 位 Y 频道的 YUV 格式。

注在本文中，U 一词相当于 Cb，V 一词相当于 Cr。

本文包括以下主题：

返回页首

在 DirectShow 中标识 YUV 格式

本文讲述的每种 YUV 格式都指定了一个 FOURCC 码。FOURCC 码是一个 32 位、不带正负号的整数，它是通过串联四个 ASCII 字符创建而成的。

有很多 C/C++ 宏可使得在源代码中声明 FOURCC 值变得更加简单。例如，MAKEFOURCC 宏是在 Mmsystem.h 中声明的，FCC 宏则是在 Aviriff.h 中声明的。请按照下列方式使用这些宏：

DWORD fccYUY2 = MAKEFOURCC('Y','U','Y','2');
DWORD fccYUY2 = FCC('YUY2');

只需通过调转字符的顺序，您还可以将 FOURCC 码直接声明为字符文本。例如：

DWORD fccYUY2 = '2YUY';  // Declares the FOURCC 'YUY2'

因为 Windows 操作系统使用的是 little-endian 体系结构，所以调转顺序是必需的。“Y”= 0x59，“U”= 0x55，“2”= 0x32，所以“2YUY”为 0x32595559。

在 DirectShow 中，格式是由一个主类型全局唯一标识符 (GUID) 和一个子类型 GUID 标识的。计算机视频格式的主类型总是 MEDIATYPE_Video。子类型则可以通过将 FOURCC 码与 GUID 进行映射的方式来构造，如下所示：

XXXXXXXX-0000-0010-8000-00AA00389B71

其中 XXXXXXXX 为 FOURCC 码。因此，YUY2 的子类型 GUID 为：

32595559-0000-0010-8000-00AA00389B71

很多这样的 GUID 都已经在头文件 Uuids.h 中进行了定义。例如，YUY2 子类型被定义为 MEDIASUBTYPE_YUY2。DirectShow 基类库还提供了一个帮助器类 FOURCCMap，该类可用于将 FOURCC 码转换为 GUID 值。FOURCCMap 构造函数采用 FOURCC 码作为输入参数。然后，您可以将 FOURCCMap 对象强制转换为相应的 GUID：

FOURCCMap fccMap(FCC('YUY2'));
GUID g1 = (GUID)fccMap;

// Equivalent:
GUID g2 = (GUID)FOURCCMap(FCC('YUY2'));

返回页首

Kr = 0.299
Kb = 0.114

第二个转换为 BT.709 中定义用于 60-Hz 的较新 YUV 格式，应该被视为用于高于 SDTV 的视频分辨率的首选格式。它的特征由下面两个不同的常量值来定义：

Kr = 0.2126
Kb = 0.0722

从 RGB 到 YUV 转换的定义以下列内容开始：

L = Kr * R + Kb * B + (1 – Kr – Kb) * G

然后，按照下列方式获得 YUV 值：

Y =                 floor(2^(M-8) * (219*(L–Z)/S + 16) + 0.5)
U = clip3(0, 2^M-1, floor(2^(M-8) * (112*(B-L) / ((1-Kb)*S) + 128) + 0.5))
V = clip3(0, 2^M-1, floor(2^(M-8) * (112*(R-L) / ((1-Kr)*S) + 128) + 0.5))

其中

函数 floor(x) 返回大于或等于 x 的最大整数。函数 clip3(x, y, z) 的定义如下所示：

clip3(x, y, z) = ((z < x) ? x : ((z > y) ? y : z))

Y 样例表示亮度，U 和 V 样例分别表示偏向蓝色和红色的颜色偏差。Y 的标称范围为 16*2M -8 到 235*2M -8。黑色表示为 16*2M -8，白色表示为 235*2M -8。U 和 V 的标称范围为 16*2M -8 到 240*2M -8，值 128*2M -8 表示中性色度。但是，实际的值可能不在这些范围之内。

对于 studio 视频 RGB 形式的输入数据，要使得 U 和 V 值保持在 0 到 2M-1 范围之内，必需进行剪辑操作。如果输入为计算机 RGB，则不需要剪辑操作，这是因为转换公式不会生成超出此范围的值。

这些都是精确的公式，没有近似值。本文后面的所有内容均派生自这些公式。

示例：将 RGB888 转换为 YUV 4:4:4

在输入为计算机 RGB，输出为 8 位 BT.601 YUV 的情况下，我们相信前面一节中给出的公式可以按照下列公式进行合理近似计算：

Y = ( (  66 * R + 129 * G +  25 * B + 128) >> 8) +  16
U = ( ( -38 * R -  74 * G + 112 * B + 128) >> 8) + 128
V = ( ( 112 * R -  94 * G -  18 * B + 128) >> 8) + 128

这些公式使用精确度不大于 8 位（不带正负号）的系数计算出 8 位结果。中间结果需要最多 16 位的精确度。

示例：将 8 位 YUV 转换为 RGB888

从原始的 RGB 到 YUV 公式，您可以为 YUV 的 8 位 BT.601 定义派生出下列关系：

Y = round( 0.256788 * R + 0.504129 * G + 0.097906 * B) +  16 
U = round(-0.148223 * R - 0.290993 * G + 0.439216 * B) + 128
V = round( 0.439216 * R - 0.367788 * G - 0.071427 * B) + 128

因此，假设：

C = Y - 16
D = U - 128
E = V - 128

将 YUV 转换为计算机 RGB 的公式可以按照下列方式进行派生：

R = clip( round( 1.164383 * C                   + 1.596027 * E  ) )
G = clip( round( 1.164383 * C - (0.391762 * D) - (0.812968 * E) ) )
B = clip( round( 1.164383 * C +  2.017232 * D                   ) )

其中 clip() 表示剪辑为范围 [0..255]。这些公式可以由下列公式进行合理近似计算：

R = clip(( 298 * C           + 409 * E + 128) >> 8)
G = clip(( 298 * C - 100 * D - 208 * E + 128) >> 8)
B = clip(( 298 * C + 516 * D           + 128) >> 8)

这些公式使用精确度必需大于 8 位的一些系数计算出每个 8 位结果，中间结果需要多于 16 位的精确度。

将 4:2:0 YUV 转换为 4:2:2 YUV

将 4:2:0 YUV 转换为 4:2:2 YUV 需要系数为 2 的垂直上转换。本节讲述了一个执行上转换的方法示例。该方法假设视频图片为逐行扫描。

注 4:2:0 到 4:2:2 隔行扫描转换过程会出现不常见的问题，难以实现。本文不会对转换从 4:2:0 到 4:2:2 的隔行扫描时出现的问题进行解决。

让输入色度样例的每个垂直行都成为一个数组 Cin[]，其范围为从 0 到 N - 1。输出图像上相应的垂直行则会成为数组 Cout[]，其范围为从 0 到 2N - 1。要转换每个垂直行，请执行下列过程：

Cout[0]     = Cin[0];
Cout[1]     = clip((9 * (Cin[0] + Cin[1]) – (Cin[0] + Cin[2]) + 8) >> 4);
Cout[2]     = Cin[1];
Cout[3]     = clip((9 * (Cin[1] + Cin[2]) - (Cin[0] + Cin[3]) + 8) >> 4);
Cout[4]     = Cin[2]
Cout[5]     = clip((9 * (Cin[2] + Cin[3]) - (Cin[1] + Cin[4]) + 8) >> 4);
...
Cout[2*i]   = Cin[i]
Cout[2*i+1] = clip((9 * (Cin[i] + Cin[i+1]) - (Cin[i-1] + Cin[i+2]) + 8) >> 4);
...
Cout[2*N-3] = clip((9 * (Cin[N-2] + Cin[N-1]) - (Cin[N-3] + Cin[N-1]) + 8) >> 4);
Cout[2*N-2] = Cin[N-1];
Cout[2*N-1] = clip((9 * (Cin[N-1] + Cin[N-1]) - (Cin[N-2] + Cin[N-1]) + 8) >> 4);

其中 clip() 表示剪辑范围为 [0..255]。

注用于处理边缘的等式在计算上可以进行简化。这些等式以这种形式显示，是为了说明图片边缘的附着效果。

实际上，这种方法会通过在四个相邻像素上插入曲线，并趋向两个最近的像素值进行加权，来计算每个缺少的值（图 14）。此示例中使用的这个特定插入方法使用一个众所周知的方法来计算半整数位置缺少的样例，这个方法称为 Catmull-Rom 插入，也称为立方回旋插入。