点阵汉字的字模读取与显示

uoyaijsx

于 2023-11-27 17:08:26 发布

阅读量960

点赞数 17

文章标签：嵌入式硬件

本文链接：https://blog.csdn.net/uoyaijsx/article/details/134649876

版权

本文介绍了汉字的机内码、区位码、国标码之间的关系及其编码规则，详细讲解了汉字点阵字形数据的存储格式，包括16*16、14_14和12_12点阵。通过学习，可以在Ubuntu环境下使用C/C++或Python调用opencv库，结合点阵字库显示图片并叠加显示姓名和学号。

摘要由CSDN通过智能技术生成

点阵汉字的字模读取与显示

一、实验内容

学习理解汉字的机内码、区位码编码规则和字形数据存储格式。在Ubuntu下用C/C++(或python) 调用opencv库编程显示一张图片，并打开一个名为"logo.txt"的文本文件（其中只有一行文本文件，包括你自己的名字和学号），按照名字和学号去读取汉字24*24点阵字形字库（压缩包中的文件HZKf2424.hz）中对应字符的字形数据，将名字和学号叠加显示在此图片右下位置。

二、汉字的机内码、区位码编码规则和字形数据存储格式

（一）国标码(交换码)

1.简介

国标码
国标码是一个四位十六进制数，它将一个汉字用两个字节表示，每个字节只有7位，与ASCII码相似。

为了避开ASCII字符中的不可显示字符0000 0000 ~ 0001 1111(十六进制为0 ~ 1F，十进制为0 ~ 31)及空格字符0010 0000(十六进制为20，十进制为32)（至于为什么要避开、又为什么只避开ASCII中0~32的不可显示字符和空格字符，后文有解释），国标码(又称为交换码)规定表示汉字的范围为(0010 0001，0010 0001) ~ (0111 1110，0111 1110)，十六进制为(21，21) ~ (7E，7E)，十进制为(33，33) ~ (126，126)（注意，GB类汉字编码为双字节编码）。

因此，必须将“区码”和“位码”分别加上32(十六进制为20H，后缀H表示十六进制)，作为国标码。也就是说，国标码相当于将区位码向后偏移了32，以避免与ASCII字符中0~32的不可显示字符和空格字符相冲突。