java汉字转换国标码_国标码(GB2312)的自动生成 | 学步园

前面已提到,汉字是由两个字节构成的,每个字节占八位(8bits),那么每个汉字需要占十六位(16bits).而且由于中文字符的每个字节的最高位为1,则每个字节的ASCII码均大于127(27-1).这是中文处理问题的基础.本文研究的是国标码(GB2312-80),即信息交换用汉字编码字符集---基本集.国标码字符的两个字节的ASCII码都是161--254之间的整数.根据这些信息,我们可以很方便的处理涉及国标码的有关程序问题.

我用java程序实现了由机器自动生成国标码.其基本思想是用循环产生每个字节的ASCII码,然后连接两个字节的字符串,再以文本形式输出到二进制文件中.代码如下:

import java.io.*;

public class GB2312_80 {

public static void main(String args[]) throws IOException{

File newDir=new File("d://java//test2");

File newFile=new File(newDir,"GB2312_80.chr");

if (!newFile.exists()){

newFile.createNewFile();

};

RandomAccessFile newFileW=new RandomAccessFile(newFile,"rw");

int i,j;

for(i=161;i<255;i++)

for (j=161;j<255;j++)

{

String m1=Integer.toString(i,2);//将ASCII码值(十进制)转换为二进制字符串

String n1=Integer.toString(j, 2);

String x=m1+n1;//连接两个字符串使之变为16位的字符串(即两个字节)

long x1=Long.parseLong(x, 2);//将字符串转换为长整型数据

newFileW.writeLong(x1);//输出字符.

}

}

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值