汉字点阵字库原理

最新推荐文章于 2024-08-16 07:35:44 发布

EluEvin

最新推荐文章于 2024-08-16 07:35:44 发布

阅读量1.3k

点赞数

分类专栏：嵌入式

嵌入式专栏收录该内容

63 篇文章 0 订阅

订阅专栏

汉字点阵字库原理

DOS前辈们经过艰辛的努力，将制作好的字模放到了一个个标准的库中以免去后辈的麻烦，这就是点阵字库文件。
         一般我们使用16*16的点阵宋体字库，所谓16*16，是每一个汉字在纵、横各16点的区域内显示的。不过后来又有了HZK12、HZK24，HZK32和HZK48字库及黑体、楷体和隶书字库。虽然汉字库种类繁多，但都是按照区位的顺序排列的。前一个字节为该汉字的区号，后一个字节为该字的位号。每一个区记录94个汉字，位号则为该字在该区中的位置。
         因此，汉字在汉字库中的具体位置计算公式为：94*(区号-1)+位号-1。减1是因为数组是以0为开始而区号位号是以1为开始的。这仅为以汉字为单位该汉字在汉字库中的位置，那么，如何得到以字节为单位得到该汉字在汉字库中的位置呢？只需乘上一个汉字字模占用的字节数即可，即：(94*(区号-1)+位号-1)*一个汉字字模占用字节数，而按每种汉字库的汉字大小不同又会得到不同的结果。以16*16点阵字库为例，计算公式则为：(94*(区号-1)+(位号-1))*32。汉字库文该从该位置起的32字节信息即记录了该字的字模信息。

☆打印字库文件和HZK12
         如果你有UCDOS的HZK24S（宋体）、HZK24K（楷体）或HZK24H（黑体），你还可以使用不同字体的大字模汉字了。HZK24系列是24*24的点阵字库，每字模占用3*24字节。如果你按照HZK16的显示方法的话，你会看到......呵呵，字被放倒了。这是因为该类字库与一般的汉字库不同，这类大字模汉字库是专供打印的打印字库，为了打印的方便将字模都放倒了，你使用时，只要将字模的位信息纵横转置显示即可。例如你如果定义为mat[24][3]则应该这样输出：
　         for(i=0;i<24;i++)
　              for(j=0;j<24;j++)
　　                 if((0x80>>i%8)&mat[j][i/8])　/*转置显示*/
　　                      putpixel(j+x,y+i,color);
　　还有一类字库HZK12，虽然属于标准字库类型，但如果你将它的字模当作12*12位计算的话，根本无法正常显示汉字。因为字库设计者为了使用的方便，字摸每行的位数均补齐为8的整数倍，于是实际该字库的位长度是16*12，虽然每行都多出了4位，但这4位都是0（不显示），并不影响显示效果。
汉字点阵字库原理
一、           汉字编码
1.        区位码
在国标GD2312—80中规定，所有的国标汉字及符号分配在一个94行、94列的方阵中，方阵的每一行称为一个“区”，编号为01区到94区，每一列称为一个“位”，编号为01位到94位，方阵中的每一个汉字和符号所在的区号和位号组合在一起形成的四个阿拉伯数字就是它们的“区位码”。区位码的前两位是它的区号，后两位是它的位号。用区位码就可以唯一地确定一个汉字或符号，反过来说，任何一个汉字或符号也都对应着一个唯一的区位码。汉字“母”字的区位码是3624，表明它在方阵的36区24位，问号“?”的区位码为0331，则它在03区3l位。

2. 机内码
汉字的机内码是指在计算机中表示一个汉字的编码。机内码与区位码稍有区别。如上所述，汉字区位码的区码和位码的取值均在1~94之间，如直接用区位码作为机内码，就会与基本ASCII码混淆。为了避免机内码与基本ASCII码的冲突，需要避开基本ASCII码中的控制码(00H~1FH)，还需与基本ASCII码中的字符相区别。为了实现这两点，可以先在区码和位码分别加上20H，在此基础上再加80H(此处“H”表示前两位数字为十六进制数)。经过这些处理，用机内码表示一个汉字需要占两个字节，分别称为高位字节和低位字节，这两位字节的机内码按如下规则表示：
高位字节 = 区码 + 20H + 80H(或区码 + A0H)
低位字节 = 位码 + 20H + 80H(或位码 + AOH)
由于汉字的区码与位码的取值范围的十六进制数均为01H~5EH(即十进制的01~94)，所以汉字的高位字节与低位字节的取值范围则为A1H~FEH(即十进制的161~254)。
例如，汉字“啊”的区位码为1601，区码和位码分别用十六进制表示即为1001H，它的机内码的高位字节为B0H，低位字节为A1H，机内码就是B0A1H。

二、点阵字库结构
1. 点阵字库存储
在汉字的点阵字库中，每个字节的每个位都代表一个汉字的一个点，每个汉字都是由一个矩形的点阵组成，0代表没有，1代表有点，将0和1分别用不同颜色画出，就形成了一个汉字，常用的点阵矩阵有12*12, 14*14, 16*16三种字库。
字库根据字节所表示点的不同有分为横向矩阵和纵向矩阵，目前多数的字库都是横向矩阵的存储方式(用得最多的应该是早期UCDOS字库)，纵向矩阵一般是因为有某些液晶是采用纵向扫描显示法，为了提高显示速度，于是便把字库矩阵做成纵向，省得在显示时还要做矩阵转换。我们接下去所描述的都是指横向矩阵字库。

2.        16*16点阵字库
对于16*16的矩阵来说，它所需要的位数共是16*16＝256个位，每个字节为8位，因此，每个汉字都需要用256/8=32个字节来表示。
即每两个字节代表一行的16个点，共需要16行，显示汉字时，只需一次性读取32个字节，并将每两个字节为一行打印出来，即可形成一个汉字。
点阵结构如下图所示：
第一字节第二字节
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

3.        14*14与12*12点阵字库
对于14*14和12*12的字库，理论上计算，它们所需要的点阵分别为(14*14/8)=25, (12*12/8)=18个字节，但是，如果按这种方式来存储，那么取点阵和显示时，由于它们每一行都不是8的整位数，因此，就会涉到点阵的计算处理问题，会增加程序的复杂度，降低程序的效率。
为了解决这个问题，有些点阵字库会将14*14和12*12的字库按16*14和16*12来存储，即，每行还是按两个字节来存储，但是14*14的字库，每两个字节的最后两位是没有使用，12*12的字节，每两字节的最后4位是没有使用，这个根据不同的字库会有不同的处理方式，所以在使用字库时要注意这个问题，特别是14*14的字库。
三、           汉字点阵获取
1.        利用区位码获取汉字
汉字点阵字库是根据区位码的顺序进行存储的，因此，我们可以根据区位来获取一个字库的点阵，它的计算公式如下：
点阵起始位置 = ((区码- 1)*94 + (位码 – 1)) * 汉字点阵字节数
获取点阵起始位置后，我们就可以从这个位置开始，读取出一个汉字的点阵。
2.        利用汉字机内码获取汉字
前面我们己经讲过，汉字的区位码和机内码的关系如下：
机内码高位字节 = 区码 + 20H + 80H(或区码 + A0H)
机内码低位字节 = 位码 + 20H + 80H(或位码 + AOH)
反过来说，我们也可以根据机内码来获得区位码：
区码 = 机内码高位字节 - A0H
位码 = 机内码低位字节 - AOH
将这个公式与获取汉字点阵的公式进行合并计就可以得到汉字的点阵位置。

==================================================================================

//hzk汉字点阵
#include <stdio.h>
#include <stdlib.h>

int main()
{
unsigned char incode[3]="我"; // 要读出的汉字，GB编码
unsigned char qh = 0, wh = 0;
unsigned long offset = 0;
char mat[16][2] = {0};
FILE *HZK = 0;
int i,j,k;

//每个汉字，占两个字节, 取其区位号
qh = incode[0] - 0xa0; //获得区码
wh = incode[1] - 0xa0; //获得位码
offset = (94*(qh-1)+(wh-1))*32; //得到偏移位置
if((HZK=fopen("hzk16", "rb")) == NULL)
{
printf("Can't Open hzk16/n");
getchar();
return 0;
}
fseek(HZK, offset, SEEK_SET);
fread(mat, 32, 1, HZK);
fclose(HZK);

//显示
for(i=0; i<16; i++)
{
for(j=0; j<2; j++)
{
for(k=0; k<8; k++)
{
if(mat[i][j] & (0x80>>k))
{//测试为1的位则显示
printf("%c",'#');
}
else
{
printf("%c",'-');
}
}
}
printf("/n");
}
getchar();
return 1;
}