YUV 格式简介

最新推荐文章于 2024-06-27 09:20:39 发布

GabbyZang

最新推荐文章于 2024-06-27 09:20:39 发布

阅读量792

点赞数

分类专栏： Q_CAMERA

Q_CAMERA 专栏收录该内容

144 篇文章 4 订阅

订阅专栏

http://blog.sina.com.cn/s/blog_602f877001017feg.html

作者： Sam (甄峰) sam_code@hotmail.com

Sam在前一家公司时，周围有相当多视频格式，音频格式高手。当时总听到诸如YUV422,YUV420,RawData等名词，但当时对这些东西有莫名的排斥，所以只知道个大概，从来不去深究其含义。最近突然需要用到这类知识，所以补一补吧。

YUV是被电视系统所采用的一种颜色编码方法。在现代彩色电视系统中，通常采用三管彩色摄影机或彩色CCD摄影机进行取像，然后把取得的彩色图像信号经分色、分别放大校正后得到RGB，再经过矩阵变换电路得到亮度信号Y和两个色差信号R－Y（即U）、B－Y（即V），最后发送端将亮度和色差三个信号分别进行编码，用同一信道发送出去。这种色彩的表示方法就是所谓的YUV色彩空间表示。采用YUV色彩空间的重要性是它的亮度信号Y和色度信号U、V是分离的。与RGB视频信号传输相比，它最大的优点在于只需占用极少的频宽（RGB要求三个独立的视频信号同时传输）。其中“Y”表示明亮度（Luminance或Luma），也就是灰阶值；而“U”和“V” 表示的则是色度（Chrominance或Chroma），作用是描述影像色彩及饱和度，用于指定像素的颜色。
如果只有Y信号分量而没有U、V分量，那么这样表示的图像就是黑白灰度图像。彩色电视采用YUV空间正是为了用亮度信号Y解决彩色电视机与黑白电视机的兼容问题，使黑白电视机也能接收彩色电视信号。

主要的采样格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。其中YCbCr 4:1:1 比较常用，其含义为：每个点保存一个 8bit 的亮度值(也就是Y值)，每 2x2 个点保存一个 Cr 和Cb 值, 图像在肉眼中的感觉不会起太大的变化。所以，原来用 RGB(R，G，B 都是 8bit unsigned) 模型， 1个点需要 8x3=24 bits（如下图第一个图），（全采样后，YUV仍各占8bit）。按4:1:1采样后，而现在平均仅需要 8+(8/4)+(8/4)=12bits（4个点，8*4（Y）+8(U)+8(V)=48bits）, 平均每个点占12bits(如下图第二个图)。这样就把图像的数据压缩了一半。

（1） YUV 4:4:4

　　YUV三个信道的抽样率相同，因此在生成的图像里，每个象素的三个分量信息完整（每个分量通常8比特），经过8比特量化之后，未经压缩的每个像素占用3个字节。

　　下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

　　存放的码流为: Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3 V3

（2） YUV 4:2:2

　　每个色差信道的抽样率是亮度信道的一半，所以水平方向的色度抽样率只是4:4:4的一半。对非压缩的8比特量化的图像来说，每个由两个水平方向相邻的像素组成的宏像素需要占用4字节内存。

　　下面的四个像素为：[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3] //Sam : 这是原始值，每个象素点都有自己本身的YUV数据。所以4个像素需要：4个Y， 4个U，4个V。

　　存放的码流为：Y0 U0 Y1 V1 Y2 U2 Y3 V3 //Sam：为什么叫YUV422呢？因为4个像素中，每个象素的Y还保存着。但U和V各自只保存了2个。

　　映射出像素点为：[Y0 U0 V1] [Y1 U0 V1] [Y2 U2 V3] [Y3 U2 V3]

（3） YUV 4:1:1

　　4:1:1的色度抽样，是在水平方向上对色度进行4:1抽样。对于低端用户和消费类产品这仍然是可以接受的。对非压缩的8比特量化的视频来说，每个由4个水平方向相邻的像素组成的宏像素需要占用6字节内存。

　　下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3] //Sam : 这是原始值，每个象素点都有自己本身的YUV数据。所以4个像素需要：4个Y， 4个U，4个V。

　　存放的码流为: Y0 U0 Y1 Y2 V2 Y3 //Sam：为什么叫YUV411呢？因为4个像素中，每个象素的Y还保存着。但U和V各自只保存了1个。

　　映射出像素点为：[Y0 U0 V2] [Y1 U0 V2] [Y2 U0 V2] [Y3 U0 V2]

（4）YUV4:2:0

　　4:2:0并不意味着只有Y，Cb而没有Cr分量。它指得是对每行扫描线来说，只有一种色度分量以2:1的抽样率存储。相邻的扫描行存储不同的色度分量，也就是说，如果一行是4:2:0的话，下一行就是4:0:2，再下一行是4:2:0...以此类推。对每个色度分量来说，水平方向和竖直方向的抽样率都是2:1，所以可以说色度的抽样率是4:1。对非压缩的8比特量化的视频来说，每个由2x2个2行2列相邻的像素组成的宏像素需要占用6字节内存。

　　下面八个像素为：[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

　　[Y5 U5 V5] [Y6 U6 V6] [Y7U7 V7] [Y8 U8 V8]

　　存放的码流为：Y0 U0 Y1 Y2 U2 Y3

　　Y5 V5 Y6 Y7 V7 Y8

　　映射出的像素点为：[Y0 U0 V5] [Y1 U0 V5] [Y2 U2 V7] [Y3 U2 V7]

　　[Y5 U0 V5] [Y6 U0 V5] [Y7U2 V7] [Y8 U2 V7]

以下是Copy网络文档。谢谢这位朋友。

YUV 与RGB之间的转换：

RGB颜色空间到YUV颜色空间的转换公式:

    Y= 0.256788*R + 0.504129*G + 0.097906*B +  16;
    U=-0.148223*R - 0.290993*G + 0.439216*B + 128;
    V= 0.439216*R - 0.367788*G - 0.071427*B + 128;

   YUV颜色空间到RGB颜色空间的转换公式:
    B= 1.164383 * (Y - 16) + 2.017232*(U - 128);
    G= 1.164383 * (Y - 16) - 0.391762*(U - 128) - 0.812968*(V - 128);
    R= 1.164383 * (Y - 16) + 1.596027*(V - 128);

( 补充:
在视频格式中基本上都用的上面的转换公式；但在其他一些
地方可能会使用下面的转换公式(不同的使用场合可能有不同的转换系数):

    Y =  0.299*R + 0.587*G + 0.114*B;
    U = -0.147*R - 0.289*G + 0.436*B;
    V =  0.615*R - 0.515*G - 0.100*B;

    R = Y + 1.14*V;
    G = Y - 0.39*U - 0.58*V;
    B = Y + 2.03*U;
  )
B.RGB32颜色和图片的数据定义:

#define asm __asm

typedef unsigned char TUInt8; // [0..255]
typedef unsigned long TUInt32;
struct TARGB32      //32 bit color
{
    TUInt8  b,g,r,a;          //a is alpha
};

struct TPicRegion  //一块颜色数据区的描述，便于参数传递
{
    TARGB32*    pdata;         //颜色数据首地址
    long        byte_width;    //一行数据的物理宽度(字节宽度)；
                //abs(byte_width)有可能大于等于width*sizeof(TARGB32);
    long        width;         //像素宽度
    long        height;        //像素高度
};

//那么访问一个点的函数可以写为：
__forceinline TARGB32& Pixels(const TPicRegion& pic,const long x,const long y)
{
    return ( (TARGB32*)((TUInt8*)pic.pdata+pic.byte_width*y) )[x];
}

(注意:__forceinline表示总是内联代码，如果你的编译器不支持，请改写为inline关键词)

C.YUYV(也可以叫做YUY2)视频格式到RGB32的转化
（本文先集中优化YUYV视频格式到RGB32的转化,然后再扩展到其他视频格式）

  YUYV视频格式的内存数据布局图示:


  图中可以看出Y的数据量是U或者V的两倍，这是因为人的眼睛一般对亮度比对颜
色更敏感一些，所以将连续的两个像素的U(或V)值只保存一个U(或V)值,那么每个
像素平均占用16bit储存空间;
  解码YUYV视频格式的一个简单浮点实现:

    //颜色饱和函数
    __forceinline long border_color(long color)
    {
        if (color>255)
            return 255;
        else if (color<0)
            return 0;
        else
            return color;
    }

    __forceinline TARGB32 YUVToRGB32_float(const TUInt8 Y,const TUInt8 U,const TUInt8 V)
    {
        TARGB32 result;
        result.b= border_color( 1.164383 * (Y - 16) + 2.017232*(U - 128) );
        result.g= border_color( 1.164383 * (Y - 16) - 0.391762*(U - 128) - 0.812968*(V - 128) );
        result.r= border_color( 1.164383 * (Y - 16) + 1.596027*(V - 128) );
        result.a= 255;
        return result;
    }

void DECODE_YUYV_Float(const TUInt8* pYUYV,const TPicRegion& DstPic)
{
    assert((DstPic.width & 1)==0);

    TARGB32* pDstLine=DstPic.pdata;
    for (long y=0;y<DstPic.height;++y)
    {
        for (long x=0;x<DstPic.width;x+=2)
        {
            pDstLine[x+0]=YUVToRGB32_float(pYUYV[0],pYUYV[1],pYUYV[3]);
            pDstLine[x+1]=YUVToRGB32_float(pYUYV[2],pYUYV[1],pYUYV[3]);
            pYUYV+=4;
        }
        ((TUInt8*&)pDstLine)+=DstPic.byte_width;
    }
}

D.使用整数运算(定点数运算)来代替浮点运算
默认的浮点数到整数的转换是比较慢的运算；这里用整数运算来代替浮点运算；
使用16位定点数，原理是将浮点系数扩大2^16倍，并保存为整数(引入很小的误差)，那么计算出来的值
再除以2^16就得到正确的结果了,而除以2^16可以优化为带符号的右移; 代码如下:

        const int csY_coeff_16 = 1.164383*(1<<16);
        const int csU_blue_16  = 2.017232*(1<<16);
        const int csU_green_16 = (-0.391762)*(1<<16);
        const int csV_green_16 = (-0.812968)*(1<<16);
        const int csV_red_16   = 1.596027*(1<<16);

    __forceinline TARGB32 YUVToRGB32_Int(const TUInt8 Y,const TUInt8 U,const TUInt8 V)
    {
        TARGB32 result;
        int Ye=csY_coeff_16 * (Y - 16);
        int Ue=U-128;
        int Ve=V-128;
        result.b= border_color( ( Ye + csU_blue_16 * Ue )>>16 );
        result.g= border_color( ( Ye + csU_green_16 * Ue + csV_green_16 * Ve )>>16 );
        result.r= border_color( ( Ye + csV_red_16 * Ve )>>16 );
        result.a= 255;
        return result;
    }

void DECODE_YUYV_Int(const TUInt8* pYUYV,const TPicRegion& DstPic)
{
    assert((DstPic.width & 1)==0);

    TARGB32* pDstLine=DstPic.pdata;
    for (long y=0;y<DstPic.height;++y)
    {
        for (long x=0;x<DstPic.width;x+=2)
        {
            pDstLine[x+0]=YUVToRGB32_Int(pYUYV[0],pYUYV[1],pYUYV[3]);
            pDstLine[x+1]=YUVToRGB32_Int(pYUYV[2],pYUYV[1],pYUYV[3]);
            pYUYV+=4;
        }
        ((TUInt8*&)pDstLine)+=DstPic.byte_width;
    }
}