这里写目录标题
一、要求:
学习理解汉字的机内码、区位码编码规则和字形数据存储格式。在Ubuntu下用C/C++(或python) 调用opencv库编程显示一张图片,并打开一个名为"logo.txt"的文本文件(其中只有一行文本文件,包括你自己的名字和学号),按照名字和学号去读取汉字24*24点阵字形字库(压缩包中的文件HZKf2424.hz)中对应字符的字形数据,将名字和学号叠加显示在此图片右下位置。
二、汉字点阵库
(一) 汉字编码
1. 区位码
在国标 GD2312—80 中规定,所有的国标汉字及符号分配在一个 94 行、94 列的方
阵中,方阵的每一行称为一个“区”,编号为 01 区到 94 区,每一列称为一个“位”,编号为
01 位到 94 位,方阵中的每一个汉字和符号所在的区号和位号组合在一起形成的四个阿拉
伯数字就是它们的“区位码”。区位码的前两位是它的区号,后两位是它的位号。用区位码就
可以唯一地确定一个汉字或符号,反过来说,任何一个汉字或符号也都对应着一个唯一的
区位码。汉字“母”字的区位码是 3624,表明它在方阵的 36 区 24 位,问号“?”的区位码为
0331,则它在 03 区 3l 位。
2. 机内码
汉字的机内码是指在计算机中表示一个汉字的编码。机内码与区位码稍有区别。如上所
述,汉字区位码的区码和位码的取值均在 1~94 之间,如直接用区位码作为机内码,就会
与基本 ASCII 码混淆。为了避免机内码与基本 ASCII 码的冲突,需要避开基本 ASCII 码
中的控制码(00H~1FH),还需与基本 ASCII 码中的字符相区别。为了实现这两点,可以
先在区码和位码分别加上 20H,在此基础上再加 80H(此处“H”表示前两位数字为十六进制
数)。经过这些处理,用机内码表示一个汉字需要占两个字节,分别 称为高位字节和低位字
节,这两位字节的机内码按如下规则表示:
高位字节 = 区码 + 20H + 80H(或区码 + A0H)
低位字节 = 位码 + 20H + 80H(或位码 + AOH)
由于汉字的区码与位码的取值范围的十六进制数均为 01H~5EH(即十进制的 01~9
4),所以汉字的高位字节与低位字节的取值范围则为 A1H~FEH(即十进制的 161~254)。
例如,汉字“啊”的区位码为 1601,区码和位码分别用十六进制表示即为 1001H,它
的机内码的高位字节为 B0H,低位字节为 A1H,机内码就是 B0A1H。
( 二)、 点阵字库结构
1. 点阵字库存储
在汉字的点阵字库中,每个字节的每个位都代表一个汉字的一个点,每个汉
字都是由一个矩形的点阵组成,0 代表没有,1 代表有点,将 0 和 1 分别用不同
颜色画出,就形成了一个汉字,常用的点阵矩阵有 1212, 1414, 16*16 三
种字库。
字库根据字节所表示点的不同有分为横向矩阵和纵向矩阵,目前多数的字库
都是横向矩阵的存储方式(用得最多的应该是早期 UCDOS 字库),纵向矩阵一
般是因为有某些液晶是采用纵向扫描显示法,为了提高显示速度,于是便把字库
矩阵做成纵向,省得在显示时还要做矩阵转换。我们接下去所描述的都是指横向
矩阵字库。
2. 16*16 点阵字库
对于 1616 的矩阵来说,它所需要的位数共是 1616=256 个位,每个字
节为 8 位,因此,每个汉字都需要用 256/8=32 个字节来表示。
即每两个字节代表一行的 16 个点,共需要 16 行,显示汉字时,只需一次
性读取 32 个字节,并将每两个字节为一行打印出来,即可形成一个汉字。
点阵结构如下图所示:
3. 1414 与 1212 点阵字库
对于 1414 和 1212 的字库,理论上计算,它们所需要的点阵分别为(14
14/8)=25, (1212/8)=18 个字节,但是,如果按这种方式来存储,那么取
点阵和显示时,由于它们每一行都不是 8 的整位数,因此,就会涉到点阵的计
算处理问题,会增加程序的复杂度,降低程序的效率。
为了解决这个问题,有些点阵字库会将 1414 和 1212 的字库按 1614
和 1612 来存储,即,每行还是按两个字节来存储,但是 1414 的字库,每
两个字节的最后两位是没有使用,1212 的字节,每两字节的最后 4 位是没有
使用,这个根据不同的字库会有不同的处理方式,所以在使用字库时要注意这个
问题,特别是 14*14 的字库。
(三) 汉字点阵获取
1. 利用区位码获取汉字
汉字点阵字库是根据区位码的顺序进行存储的,因此,我们可以根据区位来
获取一个字库的点阵,它的计算公式如下:
点阵起始位置 = ((区码- 1)*94 + (位码 – 1)) * 汉字点阵字节数
获取点阵起始位置后,我们就可以从这个位置开始,读取出一个汉字的点阵。
2. 利用汉字机内码获取汉字
前面我们己经讲过,汉字的区位码和机内码的关系如下:
机内码高位字节 = 区码 + 20H + 80H(或区码 + A0H)
机内码低位字节 = 位码 + 20H + 80H(或位码 + AOH)
反过来说,我们也可以根据机内码来获得区位码:
区码 = 机内码高位字节 - A0H
位码 = 机内码低位字节 - AOH
三、在Ubuntu下用C/C++ 调用opencv库编程显示图片
1、准备所需要的文件
一张需要显示的图片,24*24的点阵.hz文件,ASCII码.zf文件,需要显示的文本文件
在logo.txt文件当中输入你想要显示的文字的时候需要用ANSI编码进行编写,不然中文会出现乱码
然后选择另存为就可以选择ANSI编码的了:
2、调用opencv来打印logo内容到图片中:
首先进入我在ubuntu中建立的文件夹:
cd dishizhou
然后编写代码:
gedit test.cpp
代码:
1. #include<iostream>
#include<opencv/cv.h>
#include"opencv2/opencv.hpp"
#include<opencv/cxcore.h>
#include<