String a = new String("碁");
String b = new String(a.getBytes(),"ISO8859_1");
String c = new String(a.getBytes(),"gb2312");
System.out.println("b="+b+" c="+c);
String b = new String(b.getBytes("ISO8859_1"),"GBK");
String c = new String(a.getBytes("gb2312"),"GBK");
System.out.println("b="+b+" c="+c);
虚拟机的内码是GBK:
输出结果是:
b=?? c=??
b=碁 c=??
这就是奇妙之处了。
当a被转化为gb2312时由于在编码表里找不到对应的编码,故而被替代为?的编码,再转回来就是?了
而被转化为ISO8859_1时,之间将编码平移过去虽然不能正常显示,但是保证了正常转化回来。
ISO8859_1是个比较特殊的字符集,它是一个8位的编码,这就让他成为一个非常好的中介机构,会忠实的将每个字节的数据记录下来而不改变,估计这是web传输和jdbc传输使用它为字符集的原因吧。
getBytes ()使用平台默认的字符集将此String解码为字节序列,并将结果存储到一个新的字节数组中。
使用指定的字符集将此String解码为字节序列,并将结果存储到一个新的字节数组中。
String(byte[] bytes,StringcharsetName)
构造一个新的String,方法是使用指定的字符集解码指定的字节数组。
String(byte[] bytes)
构造一个新的String,方法是使用平台的默认字符集解码字节的指定数组。