基于C++实现BMP序列转YUV文件
一、实验目的
- 理解图像文件的基本组成。
- 掌握结构体作为复杂数据对象的用法。进一步熟悉由问题到程序的解决方案,并掌握编程细节:如内存分配、倒序读写、字节序、文件读写过程等。
二、实验要求
- 在图像处理软件中自行生成多个BMP文件,至少含5个不同的场景画面,要求带含有班级、学号后四位和本人姓名(缩写或昵称均可)的logo。(基本要求为24bit的BMP,进阶要求为支持小于24bit的BMP。
- 编写将第一步所生成的多个BMP文件转化为YUV文件要求可在命令行中设置每个画面出现的帧数。最后形成的YUV文件应至少包含 200 帧。重点掌握函数定义、缓冲区分配、倒序读写、结构体的操作。
- 对整个程序进行调试,并将生成的YUV文件用播放软件观看,验证是否正确。
三、实验原理
典型的BMP图像文件由四部分组成,分别为位图文件头数据、位图信息头数据、调色板、位图数据。
- 位图文件头
包含BMP图像文件的类型、显示内容等信息,共14字节。
wingdi.h
头文件中的位图文件头类:
typedef struct tagBITMAPFILEHEADER {
WORD bfType; //文件类型
DWORD bfSize; //文件大小,单位:字节
WORD bfReserved1;//保留,设为0
WORD bfReserved2;//保留,设为0
DWORD bfOffBits; //说明从BITMAPFILEHEADER结构开始到实际的图像数据之间的字节偏移量
} BITMAPFILEHEADER, FAR *LPBITMAPFILEHEADER, *PBITMAPFILEHEADER;
- 位图信息头
信息数据结构,它包含有 BMP 图像的宽、高、压缩方法,以及定义颜色等信息,共40字节。
wingdi.h
头文件中的位图信息头类:
typedef struct tagBITMAPINFOHEADER{
DWORD biSize; //说明结构体所需字节数
LONG biWidth; //以像素为单位说明图像的宽度
LONG biHeight; //以像素为单位说明图像的高度
WORD biPlanes; //说明位面数,必须为1
WORD biBitCount; //说明位数像素,1、2、4、8、24
DWORD biCompression; //说明图像是否压缩及压缩类型BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS
DWORD biSizeImage; //以字节为单位说明图像大小,必须是4的整数倍
LONG biXPelsPerMeter; //目标设备的水平分辨率,像素/米
LONG biYPelsPerMeter; //目标设备的垂直分辨率,像素/米
DWORD biClrUsed; //说明图像实际用到的颜色数,如果为0则颜色数为2的 biBitCount次方
DWORD biClrImportant; //说明对图像显示有重要影响的颜色索引的数目,如果是0,表示都重要
} BITMAPINFOHEADER, FAR *LPBITMAPINFOHEADER, *PBITMAPINFOHEADER;
- 调色板
这个部分是可选的,有些位图需要调色板,有些位图(比如真彩色图 24位的 BMP)就不需要调色板。
wingdi.h
头文件中的调色板类:
typedef struct tagRGBQUAD {
BYTE rgbBlue; //蓝色分量
BYTE rgbGreen; //绿色分量
BYTE rgbRed; //红色分量
BYTE rgbReserved;//保留,指定为0
} RGBQUAD;
本次任务中使用的图像均为真彩图像,无调色板。
- 位图数据
位图数据,这部分的内容根据 BMP 位图使用的位数不同而不同,在 24 位图中直接使用 RGB (存储顺序为BGR,每个分量占1个字节),而其他的小于 24 位的使用调色板中颜色索引值。
规定每一扫描行的字节数必须是4的整倍数,也就是DWORD对齐的。扫描行是由底向上存储的,这就是说,阵列中的第一个字节表示位图左下角的像素,而最后一个字节表示位图右上角的像素。
四、实验步骤
- 打开文件
- 读取文件头、信息头
- 判断调色板
- 读取BMP文件中的RGB数据
- RGB转YUV
- 设置帧数,输出YUV文件
1、main.cpp
主函数即按照上述流程编写。
#define _CRT_SECURE_NO_DEPRECATE
#include<iostream>
#include<Windows.h>
#include<wingdi.h>
#include"bmp2yuv.h";
using namespace std;
int main(int argc, char** argv)
{
//定义变量
BITMAPFILEHEADER File_header;
BITMAPINFOHEADER Info_header;
FILE* bmpFile = NULL;
FILE* yuvFile = NULL;
int frameWidth;
int frameHeight;
const int imageNum = 6;
const char* bmpFileName[imageNum] = { "image1.bmp","imageadd.bmp","image2.bmp","image3.bmp","image4.bmp","image5.bmp" };
const char* yuvFileName = "video.yuv";
unsigned char* rgbBuf;
unsigned char* yBuf;
unsigned char* uBuf;
unsigned char* vBuf;
bool flip = TRUE;
//打开输出文件
yuvFile = fopen(yuvFileName, "wb");
//逐个图片转换
for (int i = 0; i < imageNum; i++)
{
bmpFile = fopen(bmpFileName[i], "rb");
//读文件头、信息头
if (fread(&File_header, sizeof(BITMAPFILEHEADER), 1, bmpFile) != 1)
{
cout << "read file header error!" << endl;
exit(0);
}
if (File_header.bfType != 0x4D42)
{
cout << "Not bmp file!" << endl;
exit(0);
}
else
{
cout << "this is a bmp file!" << endl;
}
if (fread(&Info_header, sizeof(BITMAPINFOHEADER), 1, bmpFile) != 1)
{
cout << "read info header error!" << endl;
exit(0);
}
//赋值
frameWidth = Info_header.biWidth;
frameHeight = Info_header.biHeight;
//分配空间
rgbBuf = (unsigned char*)malloc(frameWidth * frameHeight * 3);
yBuf = (unsigned char*)malloc(frameWidth * frameHeight);
uBuf = (unsigned char*)malloc(frameWidth * frameHeight / 4);
vBuf = (unsigned char*)malloc(frameWidth * frameHeight / 4);
//调色板判断
RGBQUAD* pRGB = (RGBQUAD*)malloc(sizeof(RGBQUAD) * (unsigned int)pow(2, Info_header.biBitCount));
if (!MakePalette(bmpFile, File_header, Info_header, pRGB))
cout << "No palettel" << endl;
//读取BMP文件中的RGB数据
READRGB(frameWidth, frameHeight, bmpFile, rgbBuf);
//下面注释的这句是调试的时候看看RGB数据读取是否正确。
//fwrite(rgbBuf, 1, frameHeight * frameWidth * 3, yuvFile);
//RGB转YUV
if (RGB2YUV(frameWidth, frameHeight, rgbBuf, yBuf, uBuf, vBuf, flip))
{
printf("error");
return 0;
}
for (int i = 0; i < frameWidth * frameHeight; i++)
{
if (yBuf[i] < 16) yBuf[i] = 16;
if (yBuf[i] > 235) yBuf[i] = 235;
}
for (int i = 0; i < frameWidth * frameHeight / 4; i++)
{
if (uBuf[i] < 16) uBuf[i] = 16;
if (uBuf[i] > 240) uBuf[i] = 240;
if (vBuf[i] < 16) vBuf[i] = 16;
if (vBuf[i] > 240) vBuf[i] = 240;
}
//写入yuv文件
for (int i = 0; i < 40; i++)
{
fwrite(yBuf, 1, frameWidth * frameHeight, yuvFile);
fwrite(uBuf, 1, (frameWidth * frameHeight) / 4, yuvFile);
fwrite(vBuf, 1, (frameWidth * frameHeight) / 4, yuvFile);
}
//释放空间,关闭文件
free(rgbBuf);
free(yBuf);
free(uBuf);
free(vBuf);
fclose(bmpFile);
}
fclose(yuvFile);
return 0;
}
2、bmp2yuv.h
头文件中包含需要用到的函数,包括
- RGB转YUV:
RGB2YUV()
- 调色板判断:
MakePalette()
- BMP文件RGB数据读取:
MakePalette()
- 查找表:
InitLookupTable()
#define _CRT_SECURE_NO_DEPRECATE
#include<iostream>
#include<Windows.h>
#include<wingdi.h>
int RGB2YUV(int x_dim, int y_dim, void* bmp, void* y_out, void* u_out, void* v_out, int flip);
bool MakePalette(FILE* pFile, BITMAPFILEHEADER& file_h, BITMAPINFOHEADER& info_h, RGBQUAD* pRGB_out);
int READRGB(int width, int height, FILE* bmpFile, unsigned char* rgb);
void InitLookupTable();
3、bmp2yuv.cpp
这个cpp文件中实例化了所有方法函数。
(1)引头文件以及定义全局变量
#define _CRT_SECURE_NO_DEPRECATE
#include "stdlib.h"
#include "bmp2yuv.h"
#include<stdio.h>
#include<iostream>
#include<Windows.h>
#include<wingdi.h>
static float RGBYUV02990[256], RGBYUV05870[256], RGBYUV01140[256];
static float RGBYUV01684[256], RGBYUV03316[256];
static float RGBYUV04187[256], RGBYUV00813[256];
(2)RGB转YUV函数
int RGB2YUV(int x_dim, int y_dim, void* bmp, void* y_out, void* u_out, void* v_out, int flip)
{
static int init_done = 0;
long i, j, size;
unsigned char* r, * g, * b;
unsigned char* y, * u, * v;
unsigned char* pu1, * pu2, * pv1, * pv2, * psu, * psv;
unsigned char* y_buffer, * u_buffer, * v_buffer;
unsigned char* sub_u_buf, * sub_v_buf;
if (init_done == 0)
{
InitLookupTable();
init_done = 1;
}
// check to see if x_dim and y_dim are divisible by 2
if ((x_dim % 2) || (y_dim % 2)) return 1;
size = x_dim * y_dim;
// allocate memory
y_buffer = (unsigned char*)y_out;
sub_u_buf = (unsigned char*)u_out;
sub_v_buf = (unsigned char*)v_out;
u_buffer = (unsigned char*)malloc(size * sizeof(unsigned char));
v_buffer = (unsigned char*)malloc(size * sizeof(unsigned char));
if (!(u_buffer && v_buffer))
{
if (u_buffer) free(u_buffer);
if (v_buffer) free(v_buffer);
return 2;
}
b = (unsigned char*)bmp;
y = y_buffer;
u = u_buffer;
v = v_buffer;
// convert RGB to YUV
if (!flip) {
for (j = 0; j < y_dim; j++)
{
y = y_buffer + (y_dim - j - 1) * x_dim;
u = u_buffer + (y_dim - j - 1) * x_dim;
v = v_buffer + (y_dim - j - 1) * x_dim;
for (i = 0; i < x_dim; i++) {
g = b + 1;
r = b + 2;
*y = (unsigned char)(RGBYUV02990[*r] + RGBYUV05870[*g] + RGBYUV01140[*b]);
*u = (unsigned char)(-RGBYUV01684[*r] - RGBYUV03316[*g] + (*b) / 2 + 128);
*v = (unsigned char)((*r) / 2 - RGBYUV04187[*g] - RGBYUV00813[*b] + 128);
b += 3;
y++;
u++;
v++;
}
}
}
else {
for (i = 0; i < size; i++)
{
g = b + 1;
r = b + 2;
*y = (unsigned char)(RGBYUV02990[*r] + RGBYUV05870[*g] + RGBYUV01140[*b]);
*u = (unsigned char)(-RGBYUV01684[*r] - RGBYUV03316[*g] + (*b) / 2 + 128);
*v = (unsigned char)((*r) / 2 - RGBYUV04187[*g] - RGBYUV00813[*b] + 128);
b += 3;
y++;
u++;
v++;
}
}
// subsample UV
for (j = 0; j < y_dim / 2; j++)
{
psu = sub_u_buf + j * x_dim / 2;
psv = sub_v_buf + j * x_dim / 2;
pu1 = u_buffer + 2 * j * x_dim;
pu2 = u_buffer + (2 * j + 1) * x_dim;
pv1 = v_buffer + 2 * j * x_dim;
pv2 = v_buffer + (2 * j + 1) * x_dim;
for (i = 0; i < x_dim / 2; i++)
{
*psu = (*pu1 + *(pu1 + 1) + *pu2 + *(pu2 + 1)) / 4;
*psv = (*pv1 + *(pv1 + 1) + *pv2 + *(pv2 + 1)) / 4;
psu++;
psv++;
pu1 += 2;
pu2 += 2;
pv1 += 2;
pv2 += 2;
}
}
//free(u_buffer);
//free(v_buffer);
return 0;
}
(3)查找表
void InitLookupTable()
{
int i;
for (i = 0; i < 256; i++) RGBYUV02990[i] = (float)0.2990 * i;
for (i = 0; i < 256; i++) RGBYUV05870[i] = (float)0.5870 * i;
for (i = 0; i < 256; i++) RGBYUV01140[i] = (float)0.1140 * i;
for (i = 0; i < 256; i++) RGBYUV01684[i] = (float)0.1684 * i;
for (i = 0; i < 256; i++) RGBYUV03316[i] = (float)0.3316 * i;
for (i = 0; i < 256; i++) RGBYUV04187[i] = (float)0.4187 * i;
for (i = 0; i < 256; i++) RGBYUV00813[i] = (float)0.0813 * i;
}
(4)调色板函数
bool MakePalette(FILE* pFile, BITMAPFILEHEADER& file_h, BITMAPINFOHEADER& info_h, RGBQUAD* pRGB_out)
{
if ((file_h.bfOffBits - sizeof(BITMAPFILEHEADER) - info_h.biSize) == sizeof(RGBQUAD) * pow(2, info_h.biBitCount))
{
fseek(pFile, sizeof(BITMAPFILEHEADER) + info_h.biSize, 0);
fread(pRGB_out, sizeof(RGBQUAD), (unsigned int)pow(2, info_h.biBitCount), pFile);
return true;
}
else
{
return false;
}
}
(5)BMP文件中RGB数据读取
这里需要注意:由于BMP文件中数据部分是由下到上,由左到右存储,故读取RGB数据后需要进行翻转才能得到正序图像。
int READRGB(int width, int height, FILE* bmpFile, unsigned char* rgb)
{
unsigned char* bmp = (unsigned char*)malloc(sizeof(unsigned char) * width * height * 3);
unsigned char* tmp_rgb = (unsigned char*)malloc(sizeof(unsigned char) * width * height * 3);
fread(bmp, width * height * 3, 1, bmpFile);
for (int i = 0; i < width * height * 3; i++)
{
*(tmp_rgb + i) = *bmp;
bmp++;
}
//倒序转正序
for (int i = 0; i < height; i++)
{
for (int j = 0; j < width * 3; j++)
{
*(rgb + (height - 1 - i) * width * 3 + j) = *tmp_rgb;
tmp_rgb++;
}
}
return 0;
}
五、实验结果
BMP序列长度为6,故实验判断了6次是否有调色板,且均无调色板。
用YUVviewerPlus
查看生成的video.yuv
如下:
参数设定为420格式,宽高比960:540,播放速度30帧/秒。
六、问题与解决
- 在读取RGB数据的时候起先用了
for
循环跳过54字节的头信息,但是生成的结果出错,yuv文件最右一列非常怪异。而不跳过54字节的头信息,结果确实正确的。与同学讨论发现是因为fread
读取头信息的时候指针已经跳过了头信息到了数据区,因此不需要再画蛇添足再跳过54字节。 - 一图多帧的方法就是
for
循环fwrite
多次。 - 由于BMP文件位图数据从下到上从左到右,在思考怎么转换的过程中用了数学方法,比较费脑子,不知道还有什么好方法。