位图（Raster）表示

你一身傲骨怎能输

于 2025-04-29 01:19:12 发布

阅读量950

点赞数 7

分类专栏：计算机图形学文章标签：位图

本文链接：https://blog.csdn.net/qq_33060405/article/details/147598620

版权

计算机图形学专栏收录该内容

92 篇文章

订阅专栏

下面我将详细讲解位图（Raster）在计算机中的表示，包括其基本原理、内存结构、常见格式、颜色编码、以及实际应用。

1. 什么是位图（Raster Graphics）？

位图，也叫光栅图，是用**像素（Pixel）**的网格来表示图像的。每个像素都有自己的颜色信息，所有像素排成行和列，组成一幅完整的图像。

你可以把位图想象成一张马赛克拼图，每一块小色块就是一个像素。
屏幕、数码照片、扫描图片、PNG/JPG等图片文件，都是位图。

2. 位图的内存结构

2.1 像素矩阵

位图在内存中通常是一个二维数组，每个元素是一个像素的颜色值。
例如，一张1920x1080的图片，就是1920列、1080行的像素矩阵。

2.2 颜色编码

每个像素的颜色可以有不同的编码方式，常见有：

RGB：红、绿、蓝三色分量（每个分量通常8位，即0~255）
RGBA：RGB加上Alpha（透明度）
灰度：单通道，表示黑白强度
调色板索引：像素存储的是颜色表的索引

常见的每像素位数：

24位（RGB，每个像素3字节）
32位（RGBA，每个像素4字节）
8位（灰度或调色板）

2.3 内存布局

行优先：一行一行地存储
每行可能有对齐填充（如BMP格式每行4字节对齐）

C语言伪代码：

// 以RGBA为例
unsigned char image[height][width][4]; // 4表示R,G,B,A
// 访问第y行第x列的像素
unsigned char r = image[y][x][0];
unsigned char g = image[y][x][1];
unsigned char b = image[y][x][2];
unsigned char a = image[y][x][3];

3. 常见位图文件格式

BMP：最基础的位图格式，结构简单，支持多种颜色深度
PNG：无损压缩，支持透明通道
JPG/JPEG：有损压缩，适合照片
GIF：支持动画和简单透明
TIFF：常用于高质量图像存储

这些格式在文件中会有自己的头部、元数据和像素数据，读取时需要解码。

4. 位图的实际应用

屏幕显示：显示器本质上就是一个巨大的位图，每个像素点都能单独控制颜色
图片编辑：Photoshop、画图等软件操作的就是位图
游戏贴图：3D模型表面的贴图（Texture）就是位图
视频帧：每一帧都是一张位图

5. 位图的优缺点

优点：

表现细腻，适合照片、复杂图像
渲染速度快，直接显示像素即可

缺点：

放大后会失真（像素化）
文件体积大（尤其是无压缩时）

6. 位图的读取与显示（举例）

以C语言和stb_image库为例，读取PNG图片：

#include "stb_image.h"
int width, height, channels;
unsigned char* data = stbi_load("test.png", &width, &height, &channels, 0);
// data是一个width*height*channels字节的数组
// 访问第y行第x列的像素
int idx = (y * width + x) * channels;
unsigned char r = data[idx + 0];
unsigned char g = data[idx + 1];
unsigned char b = data[idx + 2];
if (channels == 4) {
    unsigned char a = data[idx + 3];
}

7. 位图与分辨率

位图的分辨率就是像素的数量（如1920x1080）
分辨率越高，图像越清晰，文件越大

8. 位图与矢量图的区别

位图：像素网格，放大后会模糊
矢量图：用数学公式描述，放大不会失真

总结

位图是用像素网格来表示图像的，每个像素有颜色信息
在内存中通常是一个二维数组，每个元素是颜色值（如RGB、RGBA）
常见格式有BMP、PNG、JPG等
位图适合照片、贴图、屏幕显示等场景

下面我将继续深入讲解位图（Raster）在计算机中的表示，包括：

位图文件格式的详细结构（以BMP和PNG为例）
位图的内存布局细节（行对齐、像素排列等）
位图的基本操作（如像素读写、缩放、旋转等）
位图的显示流程（从文件到屏幕）
位图的压缩与存储优化

1. 位图文件格式的详细结构

1.1 BMP格式（Windows位图）

BMP文件结构：

文件头（File Header）：标识文件类型、文件大小等
信息头（Info Header）：图像宽高、颜色深度等
调色板（可选）：8位及以下时使用
像素数据（Pixel Data）：实际的像素颜色

像素排列：

从左下角开始，一行一行向上排列（有些BMP是自上而下）
每行像素数据通常4字节对齐（不足补0）

示意：

+-------------------+
| 文件头            |
+-------------------+
| 信息头            |
+-------------------+
| 调色板（可选）    |
+-------------------+
| 像素数据          |
+-------------------+

C语言读取像素示例：

// 24位BMP，每像素3字节，BGR顺序
int rowSize = ((width * 3 + 3) / 4) * 4; // 4字节对齐
for (int y = 0; y < height; y++) {
    for (int x = 0; x < width; x++) {
        int offset = y * rowSize + x * 3;
        unsigned char b = data[offset + 0];
        unsigned char g = data[offset + 1];
        unsigned char r = data[offset + 2];
    }
}

1.2 PNG格式

PNG文件结构：

文件签名
一系列数据块（Chunk），如IHDR（头）、IDAT（图像数据）、IEND（结束）
支持无损压缩、透明通道、调色板等

像素数据：

通常是压缩后的RGBA数据
需要解码（如用libpng、stb_image等库）

PNG的优势：

支持透明
文件体积小（压缩）
不会失真（无损）

2. 位图的内存布局细节

2.1 行对齐

有些格式（如BMP）要求每行像素数据长度是4的倍数，不足补0
这样做是为了加快内存访问速度

2.2 像素排列顺序

有的格式是自上而下，有的是自下而上
读取时要注意行的顺序

2.3 颜色通道顺序

常见有RGB、BGR、RGBA、BGRA等
不同格式、不同库的顺序可能不同

3. 位图的基本操作

3.1 读取和写入像素

读取：

unsigned char r = data[(y * width + x) * 3 + 0];
unsigned char g = data[(y * width + x) * 3 + 1];
unsigned char b = data[(y * width + x) * 3 + 2];

写入：

data[(y * width + x) * 3 + 0] = r;
data[(y * width + x) * 3 + 1] = g;
data[(y * width + x) * 3 + 2] = b;

3.2 缩放

最近邻插值：直接取最接近的像素
双线性插值：根据周围4个像素加权平均

3.3 旋转

通过坐标变换公式，计算新像素位置
需要处理边界和插值

3.4 灰度化

灰度 = 0.299 * R + 0.587 * G + 0.114 * B

4. 位图的显示流程

加载文件：用库（如stb_image、libpng）解码为像素数组
上传到显卡：作为纹理（Texture）上传到GPU
渲染到屏幕：用OpenGL/DirectX/Vulkan等API显示

OpenGL上传纹理示例：

GLuint tex;
glGenTextures(1, &tex);
glBindTexture(GL_TEXTURE_2D, tex);
glTexImage2D(GL_TEXTURE_2D, 0, GL_RGBA, width, height, 0, GL_RGBA, GL_UNSIGNED_BYTE, data);

5. 位图的压缩与存储优化

无损压缩：PNG、GIF
有损压缩：JPG（适合照片，体积小但有失真）
调色板：8位或更低色深时，用颜色表减少存储空间
分块存储：大图像可分块存储，便于快速加载和显示

6. 位图的应用举例

游戏贴图：角色、场景的表面纹理
UI界面：按钮、图标等
医学影像：CT、MRI等扫描图像
遥感影像：卫星照片

7. 小结

位图本质是像素矩阵，内存中按行排列，每个像素有颜色值
文件格式有自己的头部、像素排列、对齐和压缩方式
常见操作包括像素读写、缩放、旋转、灰度化等
显示时需解码、上传到显卡、渲染到屏幕

我们继续深入讲解位图（Raster）在计算机中的表示，这次重点介绍：

位图的像素格式与颜色深度
位图的内存优化与压缩原理
位图的常见处理算法（如滤镜、卷积、边缘检测等）
位图与现代图形硬件的关系
位图的跨平台与跨设备适配

1. 位图的像素格式与颜色深度

1.1 颜色深度（Color Depth）

1位：黑白（每个像素1bit，0或1）
4位：16色（每个像素4bit，常用调色板）
8位：256色（每个像素8bit，调色板索引）
16位：高彩色（如RGB565，R5G6B5）
24位：真彩色（RGB，每通道8bit）
32位：真彩色+透明度（RGBA，每通道8bit）

示例：

24位RGB：0xRRGGBB
32位RGBA：0xRRGGBBAA

1.2 通道顺序

RGB：红绿蓝
BGR：蓝绿红（如BMP默认）
RGBA/BGRA：带Alpha通道
ARGB/ABGR：有些平台/库采用不同顺序

1.3 存储方式

Packed（打包）：所有通道连续存储
Planar（分平面）：每个通道单独存储（较少见）

2. 位图的内存优化与压缩原理

2.1 行对齐与填充

为了加速内存访问，很多格式要求每行像素数据长度为4字节的倍数（如BMP）
不足部分用0填充

2.2 压缩技术

无损压缩：如PNG，采用DEFLATE算法，压缩后可还原原始数据
有损压缩：如JPEG，采用DCT变换和量化，压缩率高但有失真
RLE（游程编码）：如BMP、TGA等支持，适合大面积单色区域

2.3 调色板（Palette）

8位及以下色深常用调色板，像素存储为颜色表索引
节省空间，但颜色数量有限

3. 位图的常见处理算法

3.1 卷积滤波（Convolution）

用于模糊、锐化、边缘检测等
典型算法：高斯模糊、Sobel边缘检测、Laplacian锐化

卷积公式：

output(x, y) = sum_{i=-k}^{k} sum_{j=-k}^{k} kernel(i, j) * input(x+i, y+j)

C伪代码：

for (int y = 1; y < height-1; y++) {
    for (int x = 1; x < width-1; x++) {
        float sum = 0;
        for (int ky = -1; ky <= 1; ky++) {
            for (int kx = -1; kx <= 1; kx++) {
                sum += kernel[ky+1][kx+1] * input[(y+ky)*width + (x+kx)];
            }
        }
        output[y*width + x] = sum;
    }
}

3.2 灰度化

常用加权平均法：Gray = 0.299*R + 0.587*G + 0.114*B

3.3 二值化

设定阈值，将像素分为黑/白两类

3.4 图像缩放

最近邻、双线性、三次插值等

3.5 旋转与仿射变换

通过坐标变换公式实现

4. 位图与现代图形硬件的关系

GPU纹理：位图是GPU渲染的基础，作为纹理贴图上传到显卡
硬件加速：现代GPU支持位图的缩放、旋转、混合、滤镜等操作
多分辨率适配：通过Mipmap（多级纹理）优化不同缩放下的显示效果

5. 位图的跨平台与跨设备适配

DPI适配：高分屏下需提供多分辨率位图（如@2x、@3x）
格式兼容：不同平台支持的位图格式不同（如WebP、HEIF等新格式）
色彩管理：不同设备的色域、Gamma校正需考虑

6. 位图的实际代码示例（滤镜）

高斯模糊（伪代码）：

float kernel[3][3] = {
    {1/16, 2/16, 1/16},
    {2/16, 4/16, 2/16},
    {1/16, 2/16, 1/16}
};
for (int y = 1; y < height-1; y++) {
    for (int x = 1; x < width-1; x++) {
        float r=0, g=0, b=0;
        for (int ky = -1; ky <= 1; ky++) {
            for (int kx = -1; kx <= 1; kx++) {
                int idx = ((y+ky)*width + (x+kx))*3;
                r += data[idx+0] * kernel[ky+1][kx+1];
                g += data[idx+1] * kernel[ky+1][kx+1];
                b += data[idx+2] * kernel[ky+1][kx+1];
            }
        }
        int out_idx = (y*width + x)*3;
        output[out_idx+0] = (unsigned char)r;
        output[out_idx+1] = (unsigned char)g;
        output[out_idx+2] = (unsigned char)b;
    }
}