目录
一、RGB文件转YUV文件
1.理论部分
Y = 0.2990 R + 0.5870 G + 0.1140 B
R-Y = 0.7010 R - 0.5870 G - 0.1140 B
B-Y = - 0.2990 R - 0.5870 G + 0.8860 B
为了使色差信号的动态范围控制在-0.5~0.5之间,所以需要归一化,对色差信号引入压缩系数:
U = - 0.1684 R - 0.3316 G + 0.5 B + 128
V = 0.5 R - 0.4187 G - 0.0813 B + 128
对亮度信号和色度信号进行8比特均匀量化时,需考虑码电平分配的问题。对亮度信号,共分为256个等间隔量化级,其中0~15级和236~255级为信号保护带,16~235级为使用的亮度电平;对色差信号,归一化后动态范围为-0.5~0.5,256个等间隔量化级中,128级对应色差零电平,16~240级为色差信号电平,0~15级和241~255级为保护带。
将RGB信号转换为4:2:0格式的YUV文件时,色差信号U、V的取样频率为亮度信号取样频率的1/4,在垂直和水平方向的取样点数为亮度信号Y的一半。因此需要根据公式计算得到一帧Y、U、V的数据后,要对色差信号进行下采样(即相邻正方形四个值取平均)。
2.代码部分
在代码实现时,需要使用指针。RGB文件的存储格式是BGRBGRBGR…,一个像素包含三个表示颜色的数据。4:2:0格式的YUV文件每帧分块排列。
带入公式计算时,需使用查找表函数。
在C++实现RGB文件和YUV文件的转换时,需三部分代码:主函数main.cpp、功能调用函数rgb2yuv.cpp和头文件rgb2yuv.h。
main函数
#include <stdio.h>
#include <stdlib.h>
#include <malloc.h>
#include "rgb2yuv.h"
using namespace std;
#define u_int8_t unsigned __int8
#define u_int unsigned __int32
#define u_int32_t unsigned __int32
int main(int argc, char** argv)
{
u_int Width = 256;
u_int Height = 256;
bool flip = true;
u_int8_t* rgbBuf = NULL;
u_int8_t* yBuf = NULL;
u_int8_t* uBuf = NULL;
u_int8_t* vBuf = NULL;
u_int videoFramesWritten = 0;
FILE* rgbFile = fopen("D:/大三/大三下/数据压缩/week4/test.rgb", "rb");
FILE* yuvFile = fopen("D:/大三/大三下/数据压缩/week4/out.yuv", "wb");
// 输入缓冲区
rgbBuf = (u_int8_t*)malloc(Width * Height * 3);
// 输出缓冲区
yBuf = (u_int8_t*)malloc(Width * Height);
uBuf = (u_int8_t*)malloc((Width * Height) / 4);
vBuf = (u_int8_t*)malloc((Width * Height) / 4);
if (rgbBuf == NULL || yBuf == NULL || uBuf == NULL || vBuf == NULL)
{
printf("error\n");
exit(1);
}
while (fread(rgbBuf, 1, Width * Height * 3, rgbFile))
{
if (rgb2yuv(Width, Height, rgbBuf, yBuf, uBuf, vBuf, flip))
{
printf("error");
return 0;
}
for (int i = 0; i < Width * Height; i++)
{
// 亮度信号电平16-235
if (yBuf[i] < 16) yBuf[i] = 16;
if (yBuf[i] > 235) yBuf[i] = 235;
}
for (int i = 0; i < Width * Height / 4; i++)
{
// 色差信号电平16-240
if (uBuf[i] < 16) uBuf[i] = 16;
if (uBuf[i] > 240) uBuf[i] = 240;
if (vBuf[i] < 16) vBuf[i] = 16;
if (vBuf[i] > 240) vBuf[i] = 240;
}
fwrite(yBuf, 1, Width * Height, yuvFile);
fwrite(uBuf, 1, (Width * Height) / 4, yuvFile);
fwrite(vBuf, 1, (Width * Height) / 4, yuvFile);
}
printf("the file is written\n");
fclose(rgbFile);
fclose(yuvFile);
return(0);
}
rgb2yuv.cpp
#include "stdlib.h"
#include <iostream>
#include "rgb2yuv.h"
static float RGBYUV02990[256], RGBYUV05870[256], RGBYUV01140[256];
static float RGBYUV01684[256], RGBYUV03316[256];
static float RGBYUV04187[256], RGBYUV00813[256];
int rgb2yuv(int x_dim, int y_dim, void* rgb, void* y_out, void* u_out, void* v_out, int flip)
{
static int init_done = 0;
long i, j, size;
unsigned char* r, * g, * b;
unsigned char* y, * u, * v;
unsigned char* pu1, * pu2, * pv1, * pv2, * psu, * psv;
unsigned char* y_buffer, * u_buffer, * v_buffer;
unsigned char* sub_u_buf, * sub_v_buf;
if (init_done == 0)
{
InitLookupTable();
init_done = 1;
}
// 检查x_dim和y_dim能否被2整除
if ((x_dim % 2) || (y_dim % 2)) return 1;
size = x_dim * y_dim;
// 分配内存
y_buffer = (unsigned char*)y_out;
sub_u_buf = (unsigned char*)u_out;
sub_v_buf = (unsigned char*)v_out;
u_buffer = (unsigned char*)malloc(size * sizeof(unsigned char));
v_buffer = (unsigned char*)malloc(size * sizeof(unsigned char));
if (!(u_buffer && v_buffer))
{
if (u_buffer) free(u_buffer);
if (v_buffer) free(v_buffer);
return 2;
}
b = (unsigned char*)rgb;
y = y_buffer;
u = u_buffer;
v = v_buffer;
// 将RGB转换为YUV
if (!flip) {
for (j = 0; j < y_dim; j++)
{
y = y_buffer + (y_dim - j - 1) * x_dim;
u = u_buffer + (y_dim - j - 1) * x_dim;
v = v_buffer + (y_dim - j - 1) * x_dim;
for (i = 0; i < x_dim; i++) {
// RGB文件按 BGRBGR…顺序保存
g = b + 1;
r = b + 2;
// 按亮度方程转换,对色差信号引入压缩系数,进行归一化处理
*y = (unsigned char)(RGBYUV02990[*r] + RGBYUV05870[*g] + RGBYUV01140[*b]);
*u = (unsigned char)(-RGBYUV01684[*r] - RGBYUV03316[*g] + (*b) / 2 + 128);
*v = (unsigned char)((*r) / 2 - RGBYUV04187[*g] - RGBYUV00813[*b] + 128);
b += 3;
y++;
u++;
v++;
}
}
}
else {
for (i = 0; i < size; i++)
{
// RGB文件按 BGRBGR…顺序保存
g = b + 1;
r = b + 2;
// 按亮度方程转换,对色差信号引入压缩系数,进行归一化处理
*y = (unsigned char)(RGBYUV02990[*r] + RGBYUV05870[*g] + RGBYUV01140[*b]);
*u = (unsigned char)(-RGBYUV01684[*r] - RGBYUV03316[*g] + (*b) / 2 + 128);
*v = (unsigned char)((*r) / 2 - RGBYUV04187[*g] - RGBYUV00813[*b] + 128);
b += 3;
y++;
u++;
v++;
}
}
// 子样本 UV
for (j = 0; j < y_dim / 2; j++)
{
psu = sub_u_buf + j * x_dim / 2;
psv = sub_v_buf + j * x_dim / 2;
pu1 = u_buffer + 2 * j * x_dim;
pu2 = u_buffer + (2 * j + 1) * x_dim;
pv1 = v_buffer + 2 * j * x_dim;
pv2 = v_buffer + (2 * j + 1) * x_dim;
for (i = 0; i < x_dim / 2; i++)
{
// 以正方形4个像素为单位共享1个uv,即进行下采样
*psu = (*pu1 + *(pu1 + 1) + *pu2 + *(pu2 + 1)) / 4;
*psv = (*pv1 + *(pv1 + 1) + *pv2 + *(pv2 + 1)) / 4;
psu++;
psv++;
pu1 += 2;
pu2 += 2;
pv1 += 2;
pv2 += 2;
}
}
free(u_buffer);
free(v_buffer);
return 0;
}
// 查找表函数
void InitLookupTable()
{
int i;
for (i = 0; i < 256; i++) RGBYUV02990[i] = (float)0.2990 * i;
for (i = 0; i < 256; i++) RGBYUV05870[i] = (float)0.5870 * i;
for (i = 0; i < 256; i++) RGBYUV01140[i] = (float)0.1140 * i;
for (i = 0; i < 256; i++) RGBYUV01684[i] = (float)0.1684 * i;
for (i = 0; i < 256; i++) RGBYUV03316[i] = (float)0.3316 * i;
for (i = 0; i < 256; i++) RGBYUV04187[i] = (float)0.4187 * i;
for (i = 0; i < 256; i++) RGBYUV00813[i] = (float)0.0813 * i;
}
rgb2yuv.h
#include<iostream>
using namespace std;
int rgb2yuv(int x_dim, int y_dim, void* rgb, void* y_out, void* u_out, void* v_out, int flip);
void InitLookupTable();
运行结果
将测试文件test.rgb转为out.yuv:
二、BMP文件转YUV文件
1.理论部分
BMP文件的简要介绍
BMP(Bitmap)是Windows操作系统中的标准图像文件格式,可以分成两类:设备相关位图(DDB)和设备无关位图(DIB),采用位映射存储格式,除了图像深度可选(1、4、8、16、24、32bit)以外,在绝大多数应用中不进行其他任何压缩,因此BMP文件所占用的空间很大。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。由于BMP文件格式是 Windows 环境中交换与图有关的数据的一种标准,因此在Windows环境中运行的图形图像软件都支持BMP图像格式。BMP位图文件默认的文件扩展名是bmp或者dib。
BMP文件的组成结构
(1)位图头文件数据结构,它包含 BMP 图像文件的类型、显示内容等信息;
typedef struct tagBITMAPFILEHEADER {
WORD bfType; /* 说明文件的类型 */
DWORD bfSize; /* 说明文件的大小,用字节为单位 */
WORD bfReserved1; /* 保留,设置为 0 */
WORD bfReserved2; /* 保留,设置为 0 */
DWORD bfOffBits; /* 说明从 BITMAPFILEHEADER 结构开始到实际的图像数据之间的字节偏移量 */
} BITMAPFILEHEADER;
(2)位图信息数据结构,它包含有 BMP 图像的宽、高、压缩方法,以及定义颜色等信息;
typedef struct tagBITMAPINFOHEADER {
DWORD biSize; /* 说明结构体所需字节数 */
LONG biWidth; /* 以像素为单位说明图像的宽度 */
LONG biHeight; /* 以像素为单位说明图像的高速 */
WORD biPlanes; /* 说明位面数,必须为 1 */
WORD biBitCount; /* 说明位数/像素,1、2、4、8、24 */
DWORD biCompression; /* 说明图像是否压缩及压缩类型 BI_RGB,BI_RLE8,BI_RLE4,BI_BITFIELDS */
DWORD biSizeImage; /* 以字节为单位说明图像大小,必须是 4 的整数倍*/
LONG biXPelsPerMeter; /*目标设备的水平分辨率,像素/米 */
LONG biYPelsPerMeter; /*目标设备的垂直分辨率,像素/米 */
DWORD biClrUsed; /* 说明图像实际用到的颜色数,如果为 0,则颜色数为 2 的 biBitCount次方 */
DWORD biClrImportant; /*说明对图像显示有重要影响的颜色索引的数目,如果是 0,表示都重要。*/
} BITMAPINFOHEADER;
(3)调色板,这个部分是可选的,有些位图需要调色板,有些位图,比如真彩色图(24位的 BMP)就不需要调色板;
typedef struct tagRGBQUAD {
BYTE rgbBlue; /*指定蓝色分量*/
BYTE rgbGreen; /*指定绿色分量*/
BYTE rgbRed; /*指定红色分量*/
BYTE rgbReserved; /*保留,指定为 0*/
} RGBQUAD;
(4)位图数据,这部分的内容根据 BMP 位图使用的位数不同而不同,在 24 位图中直接使用 RGB,而其他的小于 24 位的使用调色板中颜色索引值。
BMP转YUV文件实现过程
- 程序初始化(打开两个文件、定义变量和缓冲区等)
- 读取 BMP 文件,抽取或生成 RGB 数据写入缓冲区:读位图文件头(判断是否可读出、判断是否为 BMP 文件)→ 读位图信息头(判断是否读出)→ 判断像素实际点阵数 → 开辟缓冲区存,读数据,倒序存放 → 根据每像素位数不同执行不同操作。
- 调用 RGB2YUV 的函数实现 RGB 到 YUV 数据的转换
- 写 YUV 文件
- 程序收尾工作(关闭文件,释放缓冲区)
注:像素位数的不同,执行的BMP2RGB操作也不同。
- 1~8bit:构造调色板,位与移位取像素数据,查调色板,写RGB缓冲区
- 16bit:位与移位取像素数据,转换为8bit彩色分量,写RGB缓冲区
- 24/32bit:直接取像素数据写RGB缓冲区
2.代码部分
在这里只放bmp2yuv工程的main函数,该工程内还有头文件bmp2yuv.h、转换函数rgb2yuv.cpp,内容与上面的rgb2yuv部分一样。
该代码实现:每张bmp图片在生成的yuv文件中展示70帧,三张图片共210帧。
#include<windows.h>
#include<stdio.h>
#include "bmp2yuv.h"
#include<iostream>
using namespace std;
#define u_int8_t unsigned __int8
#define u_int unsigned __int32
#define u_int32_t unsigned __int32
int main(int argc, char** argv)
{
int i = 0,k = 0;
char bmp_name[7][20] = { "mh1.bmp" ,"mh2.bmp","mh3.bmp" };
FILE* yuvFile = fopen("out_video.yuv", "wb");
BITMAPFILEHEADER File_header; // 文件头
BITMAPINFOHEADER Info_header; // 信息头
int frame_width, frame_height;
// 处理三张图片
for(k=0;k<3;k++)
{
FILE* fp = fopen(bmp_name[k], "rb");
if (fread(&File_header, sizeof(BITMAPFILEHEADER), 1, fp) != 1)
{
cout << sizeof(BITMAPFILEHEADER) << endl;
printf("read file header error!");
exit(0);
}
// 位图文件头,判断是否为BMP文件
if (File_header.bfType != 0x4D42)
{
printf("Not bmp file!");
exit(0);
}
else
{
printf("this is a bmp file");
}
// 位图信息头,从中读取图片的宽、高、位数等信息
if (fread(&Info_header, sizeof(BITMAPINFOHEADER), 1, fp) != 1)
{
printf("read info header error!");
exit(0);
}
frame_width = Info_header.biWidth;
frame_height = Info_header.biHeight;
printf("\nThis is a %d bits image!\n", Info_header.biBitCount);
printf("bmp size: \t%d X %d\n", Info_header.biWidth, Info_header.biHeight);
printf("\n");
u_int8_t* rgbBuf = NULL;
u_int8_t* yBuf = NULL;
u_int8_t* uBuf = NULL;
u_int8_t* vBuf = NULL;
yBuf = (u_int8_t*)malloc(frame_width * frame_height);
uBuf = (u_int8_t*)malloc((frame_width * frame_height) / 4);
vBuf = (u_int8_t*)malloc((frame_width * frame_height) / 4);
rgbBuf = (u_int8_t*)malloc(frame_width * frame_height * 3);
fseek(fp, File_header.bfOffBits, 0);
fread(rgbBuf, frame_width * frame_height * 3, 1, fp);
// 将BMP文件转为RGB文件
unsigned char* temp = new unsigned char[frame_width * frame_height * 3];
unsigned char* temp1 = new unsigned char[frame_width * frame_height * 3];
int j = 256*256*3;
for (i=0; j>=0; i+=3, j-=3)
{
*(temp+i) = *(rgbBuf+j-3);
*(temp+i+1) = *(rgbBuf+j-2);
*(temp+i+2) = *(rgbBuf+j-1);
}
for (i=0; i<256; i++)
{
for (j=0; j<256; j++)
{
*(temp1+3*j + i*256*3) = *(temp + (255-j)*3 + i*256*3);
*(temp1+3*j + 1 + i*256*3) = *(temp + (255-j)*3 + 1 + i*256*3);
*(temp1+3*j + 2 + i*256*3) = *(temp + (255-j)*3 + 2 + i*256*3);
}
}
// 将转成的RGB文件再转为YUV文件
bool flip = true;
rgb2yuv(frame_width, frame_height, temp1, yBuf, uBuf, vBuf, flip);
//每张图片70帧,3张图片共210帧
j = 0;
for (j = 0; j < 70; j++)
{
fwrite(yBuf, 1, frame_width * frame_height, yuvFile);
fwrite(uBuf, 1, (frame_width * frame_height) / 4, yuvFile);
fwrite(vBuf, 1, (frame_width * frame_height) / 4, yuvFile);
}
}
return 0;
}
运行结果
将三张bmp图片mh1.bmp、mh2.bmp、mh3.bmp转为共210帧的yuv文件out_video.yuv。