点阵汉字的字模读取与显示

最新推荐文章于 2024-05-14 12:52:50 发布

pink_lemon

最新推荐文章于 2024-05-14 12:52:50 发布

阅读量1.5k

点赞数 1

文章标签： stm32 c++ opencv

本文链接：https://blog.csdn.net/pink_lemon/article/details/121385147

版权

本文介绍了汉字编码的区域码和机内码概念，详细讲解了16×16、14×14、12×12点阵字库的存储方式，并阐述了如何通过区位码和机内码获取汉字点阵。最后在Ubuntu环境中使用OpenCV显示图片和学号姓名的方法，包括文件格式转换和源代码实现。

摘要由CSDN通过智能技术生成

（2）14×14 与 12×12 点阵字库

三、汉字点阵获取

（1）利用区位码获取汉字

（2）利用汉字机内码获取汉字

四、Ubuntu环境下使用opencv显示图片和学号姓名

五、总结

一、汉字编码

（1）区域码

在国标 GD2312—80 中规定，所有的国标汉字及符号分配在一个 94 行、94 列的方阵中，方阵的每一行称为一个“区”，编号为 01 区到 94 区，每一列称为一个“位”，编号为 01 位到 94 位，方阵中的每一个汉字和符号所在的区号和位号组合在一起形成的四个阿拉伯数字就是它们的“区位码”。区位码的前两位是它的区号，后两位是它的位号。

用区位码就可以唯一地确定一个汉字或符号。

例如：汉字“母”字的区位码是 3624，表明它在方阵的 36 区 24 位，问号“?”的区位码为 0331，则它在 03 区 31 位。

（2）机内码

汉字的机内码是指在计算机中表示一个汉字的编码。机内码与区位码稍有区别。如上所述，汉字区位码的区码和位码的取值均在 1~94 之间，如直接用区位码作为机内码，就会与基本 ASCII 码混淆。为了避免机内码与基本 ASCII 码的冲突，需要避开基本 ASCII 码中的控制码(00H~1FH)，还需与基本 ASCII 码中的字符相区别。为了实现这两点，可以先在区码和位码分别加上 20H，在此基础上再加 80H(此处“H”表示前两位数字为十六进制数)。经过这些处理，用机内码表示一个汉字需要占两个字节，分别称为高位字节和低位字节，这两位字节的机内码按如下规则表示：

高位字节 = 区码 + 20H + 80H(或区码 + A0H)

低位字节 = 位码 + 20H + 80H(或位码 + AOH)

由于汉字的区码与位码的取值范围的十六进制数均为 01H~5EH(即十进制的 01~9 4)，所以汉字的高位字节与低位字节的取值范围则为 A1H~FEH(即十进制的 161~254)。

例如，汉字“啊”的区位码为 1601，区码和位码分别用十六进制表示即为 1001H，它的机内码的高位字节为 B0H，低位字节为 A1H，机内码就是 B0A1H。

二、点阵字库

在汉字的点阵字库中，每个字节的每个位都代表一个汉字的一个点，每个汉字都是由一个矩形的点阵组成，0 代表没有，1 代表有点，将 0 和 1 分别用不同颜色画出，就形成了一个汉字，常用的点阵矩阵有 12*12, 14*14, 16*16 三种字库。字库根据字节所表示点的不同有分为横向矩阵和纵向矩阵，目前多数的字库都是横向矩阵的存储方式(用得最多的应该是早期 UCDOS 字库)，纵向矩阵一般是因为有某些液晶是采用纵向扫描显示法，为了提高显示速度，于是便把字库矩阵做成纵向，省得在显示时还要做矩阵转换。我们接下去所描述的都是指横向矩阵字库。