收藏记录

https://blog.twofei.com/embedded/hzk.html

陪她去流浪
风止于秋水,我止于你。

Google Search
首页 朋友们 GitHub 博客程序 建议反馈 博客订阅
HZK16汉字16*16点阵字库的使用及示例程序
最近(几年前的最近)在弄硬件,买了一块彩屏,需要字库,所以就把很久以前会的知识拿出来温习了一遍,果然好多都记忆模糊了。

网上的很多代码我看过,很多都有问题,这里我帖出来的是我自己写的代码,应该没有问题。

原理
HZK16字库是符合GB2312国家标准的16×16点阵字库,HZK16的GB2312-80支持的汉字有6763个,符号682个。其中一级汉字有 3755个,按声序排列,二级汉字有3008个,按偏旁部首排列。

我们在一些应用场合根本用不到这么多汉字字模,所以在应用时就可以只提取部分字体作为己用。 HZK16字库里的16×16汉字一共需要256个点来显示,也就是说需要32个字节才能达到显示一个普通汉字的目的。

我们知道一个GB2312汉字是由两个字节编码的,范围为0xA1A1~0xFEFE。A1-A9为符号区,B0-F7为汉字区。每一个区有94个字符(注意:这只是编码的许可范围,不一定都有字型对应,比如符号区就有很多编码空白区域)。

下面以汉字「我」为例,介绍如何在HZK16文件中找到它对应的32个字节的字模数据。

前面说到一个汉字占两个字节,这两个中前一个字节为该汉字的区号,后一个字节为该字的位号。其中,每个区记录94个汉字,位号为该字在该区中的位置。所以要找到「我」在hzk16库中的位置就必须得到它的区码和位码。

区码:汉字的第一个字节-0xA0,因为汉字编码是从0xA0区开始的,所以文件最前面就是从0xA0区开始,要算出相对区码
位码:汉字的第二个字节-0xA0
这样我们就可以得到汉字在HZK16中的绝对偏移位置:offset = (94*(区码-1)+(位码-1))*32。

注解:

区码减1是因为数组是以0为开始而区号位号是以1为开始的
(94*(区号-1)+位号-1)是一个汉字字模占用的字节数
最后乘以32是因为汉字库文应从该位置起的32字节信息记录该字的字模信息(前面提到一个汉字要有32个字节显示)
图示
我画的图示:

●●●●●●●●●●●●●●●● → 0x04,0x80
●●●●●●●●●●●●●●●● → 0x0E,0xA0
●●●●●●●●●●●●●●●● → 0x78,0x90
●●●●●●●●●●●●●●●● → 0x08,0x90
●●●●●●●●●●●●●●●● → 0x08,0x84
●●●●●●●●●●●●●●●● → 0xFF,0xFE
●●●●●●●●●●●●●●●● → 0x08,0x80
●●●●●●●●●●●●●●●● → 0x08,0x90
●●●●●●●●●●●●●●●● → 0x0A,0x90
●●●●●●●●●●●●●●●● → 0x0C,0x60
●●●●●●●●●●●●●●●● → 0x18,0x40
●●●●●●●●●●●●●●●● → 0x68,0xA0
●●●●●●●●●●●●●●●● → 0x09,0x20
●●●●●●●●●●●●●●●● → 0x0A,0x14
●●●●●●●●●●●●●●●● → 0x28,0x14
●●●●●●●●●●●●●●●● → 0x10,0x0C
所以,「我」在HZK16 16*16点阵字库的存放的序列为: (一行一行地保存,共16行,每行2个字节, 共32个字节)

04 80 0E A0 78 90 08 90 08 84 FF FE 08 80 08 90
0A 90 0C 60 18 40 68 A0 09 20 0A 14 28 14 10 0C
就像下面这样:

1.jpg

以下是我自己写的示例程序, 可以自己修改成其它的数据格式.(很简单, 所以没写注释)。

关于汉字编码问题
注意:作者当时写这段代码时的环境是 Windows 平台。Windows下从控制台输入的汉字默认是 cp936 代码页编码,此代码页编码出的汉字正好就是 GB2312 编码。

但是,如果是在类Linux环境下编译使用,则得不到正确的结果。因为类Linux系统默认编码是UTF-8。UTF-8编码的汉字是3个字节,和GB2312的2个字节并不一样。

所以,需要先将UTF-8编码转换成 cp936 编码,然后才能正确地索引字库中的汉字。

比如,现在有一个a.txt文件,内容是我(换行符\n(0x0A))请忽略。

$ cat a.txt

$ hexdump -C a.txt
00000000 e6 88 91 0a |…|
00000004
可以知道,我的UTF-8编码为:0xE6 0x88 0x91。

然后,用 iconv 转码:

$ iconv -f utf-8 -t cp936 a.txt > b.txt
可以得到 GB2312/cp936 编码的中文:

$ hexdump -C b.txt
00000000 ce d2 0a |…|
00000003
即,然后用0xCE 0xD2替换掉版本3中的word数组的值即可。

示例源代码
注:此代码由于编码问题,仅能在 Windows 上正确运行。如要在类Linux平台运行,请先转码。 版本1和版本2只能在Windows上正确运行,版本3能在Linux/Unix/macOS运行。

版本1
#include <stdio.h>

int main(void)
{
FILE* fphzk = NULL;
int i, j, k, offset;
int flag;
unsigned char buffer[32];
unsigned char word[3] = “我”;
unsigned char key[8] = {
0x80,0x40,0x20,0x10,0x08,0x04,0x02,0x01
};

fphzk = fopen("hzk16", "rb");
if(fphzk == NULL){
    fprintf(stderr, "error hzk16\n");
    return 1;
}
offset = (94*(unsigned int)(word[0]-0xa0-1)+(word[1]-0xa0-1))*32;
fseek(fphzk, offset, SEEK_SET);
fread(buffer, 1, 32, fphzk);
for(k=0; k<32; k++){
    printf("%02X ", buffer[k]);
}
for(k=0; k<16; k++){
    for(j=0; j<2; j++){
        for(i=0; i<8; i++){
            flag = buffer[k*2+j]&key[i];
            printf("%s", flag?"●":"○");
        }
    }
    printf("\n");
}
fclose(fphzk);
fphzk = NULL;
return 0;

}
版本2
#include <stdio.h>
#include <stdlib.h>

int main(void)
{
FILE* fphzk = NULL;
int i, j, k, offset;
int flag;
unsigned char buffer[32];
unsigned char word[5];
unsigned char key[8] = {
0x80,0x40,0x20,0x10,0x08,0x04,0x02,0x01
};
fphzk = fopen(“hzk16”, “rb”);
if(fphzk == NULL){
fprintf(stderr, “error hzk16\n”);
return 1;
}
while(1){
printf(“输入要生成字模的汉字(多个):”);
for(;😉{
fgets((char*)word, 3, stdin);
if(word == ‘\n’)
break;
offset = (94
(unsigned int)(word[0]-0xa0-1)+(word[1]-0xa0-1))32;
fseek(fphzk, offset, SEEK_SET);
fread(buffer, 1, 32, fphzk);
for(k=0; k<16; k++){
for(j=0; j<2; j++){
for(i=0; i<8; i++){
flag = buffer[k
2+j]&key[i];
printf("%s", flag?“●”:“○”);
}
}
printf("\n");
}
printf(“uchar code key[32] = {”);
for(k=0; k<31; k++){
printf(“0x%02X,”, buffer[k]);
}
printf(“0x%02X};\n”, buffer[31]);
printf("\n");
}
}
fclose(fphzk);
fphzk = NULL;
return 0;
}
版本3
#include <stdio.h>
#include <stdlib.h>

int main(void)
{
FILE* fphzk = NULL;
int i, j, k, offset;
int flag;
unsigned char buffer[32];
unsigned char word[2] = {0xCE, 0xD2}; // 改成你的转码后的汉字编码
unsigned char key[8] = { 0x80,0x40,0x20,0x10,0x08,0x04,0x02,0x01 };
fphzk = fopen(“hzk16”, “rb”);
if(fphzk == NULL){
fprintf(stderr, “error hzk16\n”);
return 1;
}

offset = (94*(unsigned int)(word[0]-0xa0-1)+(word[1]-0xa0-1))*32;
fseek(fphzk, offset, SEEK_SET);
fread(buffer, 1, 32, fphzk);
for(k=0; k<16; k++){
    for(j=0; j<2; j++){
        for(i=0; i<8; i++){
            flag = buffer[k*2+j]&key[i];
            printf("%s", flag?"●":"○");
        }
    }
    printf("\n");
}

for(k=0; k<31; k++){
    printf("0x%02X,", buffer[k]);
}

printf("\n");

fclose(fphzk);
fphzk = NULL;
return 0;

}
相关资源
程序及源代码下载:mod.7z

各种字库下载地址:http://pan.baidu.com/share/link?shareid=2514580636&uk=320828865

发表于:2012年11月01日 ,阅读量:29508 ,标签:字库 · 单片机 · 嵌入式

版权声明:若非特别注明,本站所有文章均为作者原创,转载请务必注明原文地址。

相关文章
MSP430集成开发环境 IAR Embedded Workbench for MSP430 5.50
stm32开发 - 远离 Keil uVision, 回到 Visual Studio
彩屏图像取模,BMP图像提取程序示例
我也谈谈DS1302实时时钟芯片的操作时序
STM32中单独设置GPIO端口高8位/低8位的方法
文章评论 发表评论

Chris 3个月前
博主大大
在Linux下,能直接用C语言将UTF-8编码转换成 cp936 编码吗,而不是通过Linux命令行

【作者】桃子 3个月前
可以,你可以调用 iconv 函数。😂

Chris 3个月前
好的,但是我要在输入同时有中文和英文,转码输出后是乱码,怎么解决英文的问题
求大大赐教

【作者】桃子 3个月前
你把英文字母过滤掉就行啦。英文字母的编码 < 256(一个字节)。

刘xx 6个月前
为撒我用24*24的字库解析出来的点阵不对啊。。

【作者】桃子 6个月前
因为这个代码是针对16*16的字库的。

刘xx 6个月前
整个24*24的呗

【作者】桃子 6个月前
稍微改一下代码就可以啦,24*24的我没有使用过。
这里有篇文章写得很不错:https://www.cnblogs.com/hoodlum1980/archive/2008/02/25/1079944.html

阿神 10个月前
作者你真的厉害呀 受教了!

【作者】桃子 10个月前
谢谢谢谢!相互学习。

kitekiting 11个月前
Good,Thanks!

【作者】桃子 11个月前
啊哈哈,不客气!节日……快乐😜

羽毛 大约1年前
作者你好,不知道你还能不能看到。这篇文章对我帮助很大!不过就是我这边用的是fopen_s fprintf_s fread_s这种的,所以运行起来会有点出错,不知道该怎么改,或许可以请教一下吗?

【作者】桃子 大约1年前
能收到呀。不过,那几个新版的函数我用得很少。具体是什么问题呢?

羽毛 大约1年前
主要是我下的vs只能用新版的函数呜呜呜它在fseek和fread_s那边都说触发了断点,是不是我函数没写对呀

【作者】桃子 大约1年前
你使用旧版的函数编译的时候,仔细看编译器的警告信息。
里面有提到一个宏,好像是 _CRT_NONSTDC_NO_DEPRECATE 还是 _CRT_SECURE_NO_DEPRECATE 来着,你在项目设置里面定义一下这个宏,然后就可以使用了。
我现在没有Windows环境,无法使用VS。

羽毛 大约1年前
我找到了一个同学可以用旧版的函数!我们一起琢磨琢磨,真的是超谢谢你啦!

【作者】桃子 大约1年前
你太客气啦![可爱]

… 大约1年前
想问一下 在linux环境下代码打印出的并不是预置的汉字能不能解答一下

【作者】桃子 大约1年前
亲,评论中有人问过啦。
是因为Linux下面编码是utf8的原因,字库编码是gb2312,查询前需要转码。
晚点我有空修改一下文章。

… 大约1年前
好的,非常感谢

anonymous 2年前
谢谢!
跟ssd1306驱动的点阵排列不一样。
ssd1306是先分成上半部16个字节、下半部16个字节。
上半部16个字节每个字节从右边第1位开始读取,
lcd从每个字上半部最下面一个像素(也就是一个16x16点阵字的第8行第一列开始显示)。
显示成上半部8x16再显示下半部的8x16。

【作者】桃子 2年前
嗯嗯,不客气。你那个驱动听起来挺复杂的😅

鱼鱼鱼 2年前
谢谢大佬

【作者】桃子 2年前
不客气~[可爱]

雨墨菲 2年前
楼主 你好!!
fphzk = fopen(“hzk16”, “rb”);里面的rb是干嘛用的

【作者】桃子 2年前
以二进制方式读![擦汗]
你关注的重点不对劲啊。。。

雨墨菲 2年前
我最近在用FATFS指令集 和这个传递参数不一样 所以有点困惑

雨墨菲 2年前
楼主讲的很好 我准备给移植到 stm8 里面 希望能成功

【作者】桃子 2年前
好,预祝成功![憨笑]

baymax 2年前
key的数组是什么意思呢?

雨墨菲 2年前
按位与 是用来取当前 位 的数据

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值