啦啦啦啦啦啦

最新推荐文章于 2020-04-06 14:27:42 发布

lusic01

最新推荐文章于 2020-04-06 14:27:42 发布

阅读量1.7k

点赞数

　　前段时间，在所参与的项目中遇到了一个unicode与gb之间转码失败的问题，一些不常用汉字的编码都被转成了“??”，这些汉字没有显示出来，于是自己对相关的问题做了一些研究并最终使问题得以解决。现在就结合前面两篇的unicode与GB方面的基本原理，介绍这种制作GBK-Unicode编码对照表的方法。

　　Java的字符串String类功能强大，不但能进行一些基本的字符串操作，还可以根据需要构造指定字符集的字符串，本文所介绍的方法正是利了这一点，这种方法的基本思路是：

　　1、遍历GBK编码表中的所有汉字，使用该字的GB编码构造一个字符串。GBK编码表中各部分的汉字分块比较整齐，很容易遍历。

　　2、使用getBytes()方法取得该字符的字节数组，由于Java是用unicode来表示字符的，所以此汉字的unicode就在其中。

　　以下是一段示例代码：

　　以下是引用片段：
　
{
    int count = 0;
    for(int segIndex=0xb0; segIndex<=0xf7; segIndex++) {
        for(int charIndex=0xa1; charIndex<=0xfe; charIndex++) {
            byte [] gbkBytes = new byte[] {(byte)(segIndex), (byte)charIndex};
            byte [] unicodeBytes;
            String str = new String(gbkBytes,"GBK");

            unicodeBytes = str.getBytes("unicode");
            if(unicodeBytes.length == 4) {
                count++;
                String buffer = "";
                for (int i=0;i<gbkBytes.length;i++)
                    buffer += (int)(0x00ff&gbkBytes[i]) + " ";
                for (int i=3;i>1;i--)
                    buffer += (int)(0x00ff&unicodeBytes[i]) + " ";
                buffer += " ";
                osw.write(buffer);
            }
        }
    }
}