编码:字符串变成字符数组
解码:字符数组变成字符串
public static void main(String[] args) throws UnsupportedEncodingException {
String s = "你好";
byte[] b = s.getBytes("gbk");//采用gbk编码 变成gbk字节数组
String s1 = new String(b,"gbk");//采用gbk解码
}
编码和解码采用的编码表必须一样否则无法正确显示.上面例子的过程如下:
如果解码时编码表错了,可用下面方法解决
public static void main(String[] args) throws UnsupportedEncodingException {
String s = "你好";
byte[] b = s.getBytes("gbk");//采用gbk编码
String s2 = new String(b,"ISO8859-1");//采用ISO8859解码,如果打印s2显示??
byte[] b1 = s2.getBytes("ISO8859-1");//再次用ISO8859编码得到正确字节数组
String s1 = new String(b,"gbk");//采用gbk解码
}
运行上面例子会发现s1正确显示"你好".可以说解码是编码的反过程
在解码的过程中,如果gbk编码用utf-8解码后,是无法通过再次编码解码得到正确数据的。
public static void main(String[] args) throws UnsupportedEncodingException {
String s = "你好";
byte[] b = s.getBytes("gbk");//采用gbk编码
String s2 = new String(b,"utf-8");//
byte[] b1 = s2.getBytes("utf-8");//
String s1 = new String(b,"gbk");//采用gbk解码
}
这是因为utf-8和gbk 同样支持中文,而且在utf-8中中文的编码一般是3个字节造成的。