@TOC
Java中为什么有时候通过指定编码集无法解决乱码
当我们编程的时候都遇到过出现乱码的情况,这通常是使用了不匹配的编码表导致的,这是我们可以用指定的编码表的方式解决乱码问题如下面 的代码
String str = "你";
byte[] ch_gbk = str.getBytes("GBK");
System.out.println(Arrays.toString(ch_gbk));// [-60, -29]
// 这里我们模拟用错编码表导致乱码
String srt_2 = new String(ch_gbk, "ISO8859-1");
System.out.println(srt_2);
// 这时候我们可以同指定编码解码集的方式解码再编码的方式解决乱码
byte[] byte_gbk = srt_2.getBytes("ISO8859-1");
System.out.println(new String(byte_gbk, "GBK"));
System.out.println(Arrays.toString(byte_gbk));// [-60, -29]
但是有时候我们同过这种方式依然无法解决乱码,。例如同样的代码当我用utg-8编解码的时候,依然是乱码,仔细看代码你就会发现,"你"用字节表示是[-60, -29],当我用utf-8编解码后他的字节形式变成了[-17, -65, -67, -17, -65, -67],也就是说当我们utf-8查表发现不匹配时会返回[-17, -65, -67, -17, -65, -67]替代了我们原来"你“的字节[-60, -29],这样我在通过指定编码表当然就解决不了乱码
String str = "你";
byte[] ch_gbk = str.getBytes("GBK");
System.out.println(Arrays.toString(ch_gbk));// [-60, -29]
// 这里我们模拟用错编码表导致乱码
String srt_2 = new String(ch_gbk, "utf-8");
System.out.println(srt_2);
// 这时候我们可以同指定编码解码集的方式解码再编码的方式解决乱码
byte[] byte_gbk = srt_2.getBytes("utf-8");
System.out.println(new String(byte_gbk, "GBK"));
System.out.println(Arrays.toString(byte_gbk));// [-17, -65, -67, -17, -65, -67]