编码，字体与字库

最新推荐文章于 2019-01-15 21:08:00 发布

aisq

最新推荐文章于 2019-01-15 21:08:00 发布

阅读量2.8k

点赞数

文章标签： postscript ttf linux dos 引擎 fonts

　　字体（就是font文件中内容）分为点阵字体与矢量字体两大类

　　点阵字体，是把每一个汉字分成 16 x 16 或者 24 x 24个点，然后用每个点的虚实来表示汉字的轮廓，常用来作为显示字库使用，这类点阵字库的最大缺点就是不能放大，一旦放大就会发现文字的边缘锯齿

　　矢量字体，保存的是对每一个汉字的描述信息，比如一个笔划的起始、终止坐标，半径、弧度等等在显

　　示、打印这一类字库时，要经过一系列的数学运算才能输出结果，但是这一类字库保存的汉字理论上可

　　以被无限地放大，笔划轮廓仍然能保持圆滑，打印时使用的字库均为此类字库Windows使用的字库也

　　为以上两类，在FONTS目录下，如果字体扩展名为FON，表示该文件为点阵字库，扩展名为TTF则表示

　　矢量字库点阵字库文件的图标为一个红色的“A”，矢量字库图标是两个“T”

　　DOS下的点阵汉字

　　你是否碰到过用启动盘启动系统后用DIR命令得到一串串莫名其妙的字符？有经验的朋友会告诉你：那是汉字汉字？你不禁会问：怎么一个我一个也不认识但那确确实实是汉字，如果你启动UCDOS或其他的汉字系统后，就会看到那是一个个熟悉的汉字同样是汉字，为什么前后会看到不同的结果？呵呵，其实在电脑硬件中，根本没有汉字这个概念，也没有英文的概念，这铁玩意认识的概念只有——内码

　　汉字的内码

　　点头表示什么？是“对”、“YES”，偏偏有的地方表示的意义却恰恰相反一个动作，有不同的诠释；一个问题，有不同的答案；而一个符号，却有不同的意义，关键在于：你是如何地理解在电脑中亦如此，所有的数据都是以0和1保存的，按不同的数据操作，可以得到不同的结果对于显示英文操作，由于英文字母种类很少，只需要8位（一字节）即可而对于中文，常用却有5000以上，于是我们的DOS前辈想了一个办法，就是将ASCII表的高128个很少用到的数值以两个为一组来表示汉字，即汉字的内码而剩下的低128位则留给英文字符使用，即英文的内码不信，你可以用记事本写一C文件：

　　main()

　　{

　　unsigned char *s,*e="ABcd",*c="你好";

　　clrscr();

　　printf("English char =");

　　s=e;

　　while(*s!=0) /*C的字符串以0为结束符*/

　　{

　　printf("%3d,",*s);

　　s++;

　　}

　　printf("/nChinease char=");

　　s=c;

　　while(*s!=0)

　　{

　　printf("%3d,",*s);

　　s++;

　　}

　　getch();

　　}

　　再用TC输渗透*.txt打开运行，看见了没有，那些数值即英文和汉字的各字节内码

　　汉字字模

　　得到了汉字的内码后，还仅是一组数字，那又如何在屏幕上去显示呢？这就涉及到文字的字模，字模虽然也是一组数字，但它的意义却与数字的意义有了根本的变化，它是用数字的各位信息来记载英文或汉字的形状，如英文的'A'在字模中是这样记载的：

而中文的“你”在字模中却是这样记载的：

　　

　　在硬件系统内，英文的字模信息一般固化在ROM里，即使在没有进入系统的CMOS里，也可以让你看到英文字符而在DOS下，中文的字模信息一般记录在汉字库文件HZK16里

　　汉字库文件了解字母和汉字是按字模位信息显示的原理后，那如何得到汉字的字模信息呢？难道要我们自己去做？NO一般我们使用16*16的点阵宋体字库，所谓16*16，是每一个汉字在纵、横各16点的区域内显示的不过后来又有了 HZK12、HZK24，HZK32和HZK48字库及黑体、楷体和隶书字库虽然汉字库种类繁多，但都是按照区位的顺序排列的前一个字节为该汉字的区号，后一个字节为该字的位号每一个区记录94个汉字，位号则为该字在该区中的位置因此，汉字在汉字库中的具体位置计算公式为：94*(区号-1)+位号-1减1是因为数组是以0为开始而区号位号是以1为开始的这仅为以汉字为单位该汉字在汉字库中的位置，那么，如何得到以字节为单位得到该汉字在汉字库中的位置呢？只需乘上一个汉字字模占用的字节数即可，即：(94*(区号-1)+位号-1)*一个汉字字模占用字节数，而按每种汉字库的汉字大小不同又会得到不同的结果以16*16点阵字库为例，计算公式则为：(94*(区号-1)+(位号-1))*32汉字库文该从该位置起的32字节信息即记录了该字的字模信息

　　汉字库文件

　　了解点阵汉字及汉字库的构成原理后，显示汉字就变得简单以16*16点阵字库为例，通常的方法是：将文件工作指针移到需要的汉字字模处、将汉字库文件读入一2*16数组再用for循环一位位地显示以使用VGAHI模式显示“我”字为例，程序如下：

　　#include "graphics.h"

　　#include "stdio.h"

　　main()

　　{

　　int i=VGA,j=VGAHI,k;

　　unsigned char mat[16][2],chinease[3]="我";

　　FILE *HZK;

　　if((HZK=fopen("hzk16","rb"))==NULL)

　　exit(0);

　　initgraph(&i,&j,"");

　　i=chinease[0]-0xa0;j=chinease[1]-0xa0; /*获得区码与位码*/

　　fseek(HZK,(94*(i-1)+(j-1))*32l,SEEK_SET);

　　fread(mat,32,1,HZK);

　　for(j=0;j<16;j++)

　　for(i=0;i<2;i++)

　　for(k=0;k<8;k++)

　　if(mat[j][i]&(0x80>>k)) /*测试为1的位则显示*/

　　putpixel(i*8+k,j,WHITE);

　　getch();

　　closegraph();

　　fclose(HZK);

　　}

　　怎么样？只要掌握了正确的方法，显示汉字并不复杂

　　打印字库文件和HZK12 如果你有UCDOS的 HZK24S（宋体）、HZK24K（楷体）或HZK24H（黑体），你还可以使用不同字体的大字模汉字了HZK24系列是24*24的点阵字库，每字模占用3*24字节如果你按照HZK16的显示方法的话，你会看到......呵呵，字被放倒了这是因为该类字库与一般的汉字库不同，这类大字模汉字库是专供打印的打印字库，为了打印的方便将字模都放倒了，你使用时，只要将字模的位信息纵横转置显示即可例如你如果定义为mat[24][3]则应该这样输出：

　　for(i=0;i<24;i++)

　　for(j=0;j<24;j++)

　　if((0x80>>i%8)&mat[j][i/8]) /*转置显示*/

　　putpixel(j+x,y+i,color);

　　还有一类字库HZK12，虽然属于标准字库类型，但如果你将它的字模当作12*12位计算的话，根本无法正常显示汉字因为字库设计者为了使用的方便，字摸每行的位数均补齐为8的整数倍，于是实际该字库的位长度是16*12，虽然每行都多出了4位，但这4位都是0（不显示），并不影响显示效果

　　问题:1 内码与字模的关系？

　　内码指明需要显示的是那个字，字模规定详细怎样来显示这个字

　　可以参考下面的《国标码，区位码，内码之间的关系》引文，明白怎么通过内码找到要显示的字

　　2 linux下字体的显示原理或者顺序？

　　From:http://blog.csdn.net/kt400_hhx/archive/2007/0 6/07/1641590.aspx

　　字库与编码关系

　　字库是由字模组成的字库是编码表字符显示的描述文件字符编码是在字库中查询需要显示的字符的索引值

　　不同的编码就应该有不同的字库，比如unicode编码就有unicode的字库Gb2312编码就有gb2312的字库字库格式

　　字库的格式主要有TrueType(ttf),PostScript(rip),OpenType等

　　TrueType是微软定义的字库格式，主要用于软件显示这种要求精度不高的环境，

　　PostScript是Adobe定义的字库格式，主要用于排版印刷等大字打印精度要求很高的环境

　　OpenType是TrueType与PostScript的综合格式，并且是使用了unicode的编码

　　TTF 和 TTC

　　TTC是几个TTF合成的字库，安装后字体列表中会观到两个以上的字体两个字体中大部分字都一样时，可以将>两种字体做成一个TTC文件，现在常见的TTC中的不同字体，汉字一般没有差别，只是英文符号的宽度不一样，>以便适应不同的版面要求

　　字体引擎

　　字体引擎用于读取字库，显示文字，文字转换等操作现在免费的字体引擎有FreeType.

　　点阵字体和矢量字体的区别

　　http://blog.21ic.com/user1/942/archives/2006/11368 .html

　　点阵汉字的显示原理

　　http://blog.chinaunix.net/u/7270/showart_311100.ht ml

　　国标码，区位码，内码之间的关系

　　http://www21.blogchina.com/www21/5419647.html

　　汉字的字模与显示

　　http://blog.chinaunix.net/u/19881/showart_347012.h tml

　　linux 下的字体原理

　　http://hi.baidu.com/limu100/blog/item/21b7deef1fef 6b15fcfa3c0e.html

　　探究X Window System运行原理与启动过程

　　http://www.5dlinux.com/article/6/2007/linux_11215. html

　　Linux中文字体的加载!!

　　http://www.mcublog.com/blog/user1/16/archives/2006 /12690.html

　　如何在linux下安装simsun字体的个人体会(转)

　　http://hi.baidu.com/renyijiu/blog/item/53cd7f032e6 e60e809fa9360.html

aisq

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
编码，字体与字库

2010-08-27 16:41　　字体（就是font文件中内容）分为点阵字体与矢量字体两大类　　点阵字体，是把每一个汉字分成 16 x 16 或者 24 x 24个点，然后用每个点的虚实来表示汉字的轮廓，常用来作为显示字库使用，这类点阵字库的最大缺点就是不能放大，一旦放大就会发现文字的边缘锯齿　　矢量字体，保存的是对每一个汉字的描述信息，比如一个笔划的起始、终止坐标，半径、弧度等等在显　　示、打印这一类字库时，要经过一系列的数学运算才能输出结果，但是这一类字库保存的汉字理论上可
复制链接

扫一扫