汉字的编码与字模点阵小结

 汉字的编码与字模点阵小结
作者: laomai
url:  http://blog.csdn.net/laomai
转载时请注明出处
一、引言
今天是三八节,为了祝一个mm节日快乐,
自己动手写了一个简单的字符灌水机,
运行效果如下图(csdn的blog好象对空格可以自动过滤,

大家凑活着看吧,反正只要给MM看的时候显示正常就行:-)

         节      节
节节节节节节节节节节节
      节      节
      节      节
  节节节节节节节节节
        节        节
        节        节
        节        节
        节  节节节
        节
        节

    日日日日日日日日
    日            日
    日            日
    日            日
    日日日日日日日日
    日            日
    日            日
    日            日
    日            日
    日日日日日日日日
    日            日


  快        快
  快        快
  快    快快快快快快
快快快      快    快
快快  快    快    快
  快        快    快
  快  快快快快快快快快
  快        快
  快      快  快
  快    快      快
  快快快          快快
           
            乐乐乐
    乐乐乐乐
    乐      乐
    乐      乐
  乐        乐    乐
  乐乐乐乐乐乐乐乐乐乐
      乐    乐乐
    乐      乐  乐
  乐        乐    乐
乐          乐      乐
        乐乐乐  
在写程序的过程中顺便把汉字内码、编码和点阵的概念理了一下,
这里把心得发出来,欢迎大家拍砖.

二、汉字的内码、编码和点阵
汉字显示的基本原理,计算机内一般都有汉字的字模库(也就是我们所说的点阵).
在dos下显示汉字的基本过程是
⑴计算机首先得到汉字的内码,这个就是存储在文本文件中的16进制数字,
⑵由内码计算出汉字的区位码
⑶由区位码得到字库文件中汉字点阵的真实位置
⑷按点阵(坐标)信息在屏幕上的对应位置打点,就形成了我们看到的汉字字符

下面具体说一下其中的几个概念
1、内码
   内码就是汉字在计算机上存储时的编码,比如我们写一个文本文件,内容为
   "节日快乐",用16进制编辑器打开它,其内容为
   BD DA C8 D5 BF EC C0 D6
   这里的bd da就是第一个汉字"节"的内码.

2、区位码
   区位码是国标gb2312中规定的汉字编码,这个是用来指导字库(点阵)文件
的国家标准,不同的字库文件(比如12*12,16*16,24*24),其显示用来的点阵
规模不共同,但是存储汉字的顺序都是一致的。这个会在后面会举例说明。
 我们要知道的是,gb2312规定的区位码实际上就是一个94×94的矩阵。
在此方阵中,每一行称为一个”区”,每一列称为一个”位”,
因此,这个方阵实际上组成了一个有94个区(编号范围为十进制的1到94)、
每个区内有94个位(编号范围为1到94)的汉字字符集。
一个汉字所在的区号和位号简单地组合在一起就构成了该汉字的”区位码”。
在汉字的区位码中,高两位为区号,低两位为位号。
比如"节"的区位码为
 节 2958
其中  区码为29,也就是16进制的1D
   位码为58, 也就是16进制的3A
所有汉字的区位码可以在下面的网址查到
http://www.knowsky.com/resource/gb2312tbm.htm

3、内码与区位码的转换
 内码高位=区码+A0(也就是10进制的160)
 内码低位=位码+A0
 
我们用"节"字来验证一下,
    内码低位为 DA = 区码3A+A0
    内码高位为 BD = 位码1D+A0
注意在intel的机器上,内码的高位存储在低地址上,低位存储在高地址上.    

4、点阵
 对计算机而言,每个汉字其实是一个点的方阵,
 标0的位置涂黑(背景色),标1的位置涂白(前景色),
 使这个方阵在屏幕看起来象一个汉字而已。比如"一"字,
 其12*12字库文件中的点阵信息为
 000000000000
 000000000000
 000000000000
 000000000000
 000000000100
 111111111110
 000000000000
 000000000000
 000000000000
 000000000000
 000000000000
 000000000000
 计算机在把汉字输出到显示设备上时,就按照点阵中的信息在屏幕的
对应位置上涂色,标0的涂背景色(默认为黑色),标0的涂前景色(默认为白色)
就形成了我们在屏幕上看到的汉字。
 

5、字库文件
    要显示汉字,就必须得到它的点阵信息,而前面说过,汉字的点阵信息是按照区位码的顺序存储在字库文件中的。所以要想取出某个汉字的点阵信息,就必须知道该汉字在字库中的位置,这个位置的计算公式为
 94*(区号-1)+位号-1
 减1是因为文件中的偏移量是以0为开始而区号位号是以1为开始的,需要换算一下。
 不过现在得到的还只是该汉字在字库中的位置,要得到在字模文件中的具体存储位置
 还要乘上一个汉字字模占用的字节数。
 一个汉字字模站用的字节数就是其点阵占用的的字节数,比如对12*12字模,
占用的 字节数就是12*12/8=16字节.
 
综合起来,一个汉字点阵在字库文件中的存储位置计算公式为
 (94*(区号-1)+位号-1)*(单个字模的字节数)
 而 单个字模的字节数=点阵的行数*点阵的列数/一个字节所占的位数 

三、实现简单的字符灌水机         
了解了以上的预备知识,我们就可以输出汉字点阵信息的程序了。代码如下

 

#include  " stdio.h "
#include 
" string.h "
#include 
" stdlib.h "

const   int  reglen  =   94 ;        // 每区(行)有 94 位(列)
const   int  font_width   =   12 ;   //  单字点阵宽度(列数)
const   int  font_height  =   12 ;   //  单字点阵高度(行数)
const   int  dotsize  =  font_width  *  font_height  / 8 ;    // 一个汉字点阵所占的字节数
const   int  subcode  =   0xa0 ;       // 内码与区、位码的差值

char   * font_file_name   =   " simsun12.fon " //  点阵字库文件名
char  str[]  =   " " ;     // 要显示点阵信息的汉字
char  bindot[dotsize]  =   {0} ;    // 存储点阵信息的数组

void  printcharbindot( char *  bindot,  int  dotlen);
int  main( int  argc,  char *  argv[])
{
    FILE 
*fp = fopen(font_file_name, "rb");
    
int string_size = font_width * font_height;

    
int i=0,j=0;
    unsigned 
char regcode;  //区码
    unsigned char bitcode;  //位码 

    
// 计算区位码,
    regcode = (unsigned char) str[i] - subcode;
    bitcode 
= (unsigned char) str[i+1- subcode;

    
//再计算汉字在字库中的位置,进而得出此字符点阵在字体文件中的偏移
    int offset = ( (regcode-1* reglen + bitcode-1* dotsize;
    
    
// 在字库文件中读取其点阵数据
    fseek(fp, offset, SEEK_SET);
    fread(bindot, sizeof(bindot),
1, fp);
    
    
//输出其点阵信息
    printcharbindot(bindot, dotsize);
    
    fclose(fp);
    system(
"pause");
    
return 0;
}


// 按顺序输出点阵的每一位信息
void  printcharbindot( char *  bindot,  int  len)
{
    
int charnum = 0;  //当前字节号
    int bitnum  = 0;  //已读取的位数
    int bitindex =0;  //当前位号
    int bitvalue;     //当前位的值
    for (charnum =0; charnum < len; ++charnum)
    
{
        
//从高到低顺次输出一个字节的每位信息
        for(bitindex = 7;bitindex>=0--bitindex)
        
{
            
//输出当前字节第bitindex位的值
            bitvalue  = ((bindot[charnum]>>bitindex) & 0x1 );  
            printf(
"%c", bitvalue+'0');

            
//满12位输出一行
            if ((++bitnum %12== 0)
                printf(
" ");
        }

    }

}

 

 

 

运行时用到的字库文件simsun12.fon可以到这里下载
http://www.ugia.cn/wp-data/fontfun.rar

运行结果为
000000000000
000000000000
000000000000
000000000000
000000000100
111111111110
000000000000
000000000000
000000000000
000000000000
000000000000
000000000000

这个程序稍加改动,就可以做出我们前面所说的字符灌水机了,
请读者自行实现.

四、致谢
在写这篇学习笔记的时候参考了以下两篇文章中的内容,在此向这两篇
文章的作者表示钦佩和感谢.
实现代码的部分参考了
http://www.ugia.cn/?p=82    作者legend
区位码和点阵部分参考了
http://dev.gameres.com/Program/Control/fontDOS.htm  作者吴进

  • 1
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Win7无法打开汉字字模点阵数据批量生成工具的原因可能有以下几点: 1. 兼容性问题:某些旧版本的汉字字模点阵数据批量生成工具可能不兼容Win7操作系统。这可能是由于工具的开发者没有及时更新工具版本以适应新操作系统的特性和要求导致的。 2. 安全性设置:Win7有更加严格的安全性设置,可能会阻止或限制运行某些不受信任的软件。如果未知的字模点阵数据批量生成工具没有通过数字签名验证,系统可能会拒绝其运行。 3. 缺少必要的软件依赖项:该工具可能需要某些特定的软件依赖项来运行,而在Win7上缺少这些依赖项可能导致无法打开和运行该工具。 解决这个问题的方法可以尝试以下几种途径: 1. 更新软件版本:如果汉字字模点阵数据批量生成工具有更新的版本,可以尝试将软件更新至最新版本,以提高兼容性。 2. 兼容性模式:可以尝试将工具设置为Win7的兼容性模式,然后再尝试运行该工具,方法为:右键点击工具的可执行文件 -> 属性 -> 兼容性 -> 将工具设置为兼容模式,选择与之前的操作系统版本相对应的选项。 3. 安装必要的软件依赖项:如果确定该工具需要某些特定的软件依赖项来运行,可以尝试安装或更新这些依赖项,以解决问题。 4. 寻求替代工具:如果上述方法均无效,可以尝试寻找其他能够运行在Win7上的汉字字模点阵数据批量生成工具,以替代原先的工具。 总之,要解决Win7无法打开汉字字模点阵数据批量生成工具的问题,需要了解具体的错误信息、软件版本和系统设置等方面的情况,并结合适当的解决方法来尝试解决问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值