字库原理 GB2312-80

猫猫的小茶馆

于 2025-08-27 20:09:28 发布

阅读量597

点赞数 4

CC 4.0 BY-SA版权

分类专栏： STM32 文章标签： stm32 嵌入式硬件单片机 mcu pcb工艺智能硬件物联网

本文链接：https://blog.csdn.net/qq_39725309/article/details/150934145

58 篇文章

订阅专栏

这篇文章介绍的是在嵌入式开发中常常会遇见的 中文字体点阵字库（如汉字库）的核心编码原理：区位码 + 偏移计算 + 内存映射。我们将会介绍 GB2312-80 字库的工作机制。

GB2312-80 是中国国家标准定义的一套简体汉字编码表，它包含：

每个汉字都有一个对应的区号和位号（统称区位码）：

示例：汉字 “中” 的区位码是： 54 区 48 位

📌 在计算机中的存储方式：

那么，为什么是加 0xA0（即十进制 160）？

为了避开 ASCII 的控制字符（0x00~0x1F），并使高位始终为 1，避免与 ASCII 字符混淆。

请添加图片描述

在图中我写了计算公式：

offset = ((区号 - 0xA1) * 94 + (位号 - 0xA1)) * 每个汉字所占字节数

“中”的编码是 0xD6D0，即：

offset = ((0xD6 - 0xA1) * 94 + (0xD0 - 0xA1)) * 32
       = ((0x35) * 94 + 0x2F) * 32
       = (53 * 94 + 47) * 32
       = 5029 * 32
       = 160928

所以，“中” 对应的点阵字模在字库文件中的偏移地址是 160928 字节 处起始的 32 字节数据。

以 16x16 点阵为例：

每行 16 个像素，2 字节（16 位）
一共 16 行，共 32 字节
每个 bit 表示一个像素点（0=背景，1=前景）

uint8_t buf[32];
FILE* f = fopen("HZK16", "rb");
fseek(f, offset, SEEK_SET);
fread(buf, 1, 32, f);
fclose(f);

然后将 buf 中的每个 bit 按行绘制在 LCD/LED 屏上，即可显示汉字。

0x00 0x7E → 00000000 01111110
            ↑↑↑↑↑↑↑↑ 行1

0x18 0x18 → 00011000 00011000
            ↑↑↑↑↑↑↑↑ 行2

... 以此类推，共16行

综上。汉字字库通过 区位码映射 + 偏移计算 + 点阵数据读取，实现了在嵌入式系统（如 STM32）中汉字的快速显示，是图形化界面和字符屏的基础。

以上，欢迎有从事同行业的电子信息工程、互联网通信、嵌入式开发的朋友共同探讨与提问，我可以提供实战演示或模板库。希望内容能够对你产生帮助！