代码中关于乱码问题
乱码问题
现在很多程序中都会存在乱码问题, 说来说去就是对编码和解码有一些错误的用法,下面是我写的一个测试,希望可以帮助到大家
package cn.lacohou.encoding;
import java.io.UnsupportedEncodingException;
import java.nio.charset.StandardCharsets;
import java.util.Arrays;
/**
* 一些编码格式问题
* @author laochou
*
*/
public class ISOToUTF {
private static void ISOToUTF8(String line) throws UnsupportedEncodingException {
// 获取字符的三种解码
byte[] bytes_iso = line.getBytes(StandardCharsets.ISO_8859_1);
byte[] bytes_utf = line.getBytes(StandardCharsets.UTF_8);
byte[] bytes_gbk = line.getBytes("gbk");
System.out.println("iso 解码 " + Arrays.toString(bytes_iso));
System.out.println("utf 解码 " + Arrays.toString(bytes_utf));
System.out.println("gbk 解码 " + Arrays.toString(bytes_gbk));
// 使用utf8编码, 使用iso, gbk 进行解码
String utfIsoLine = new String(bytes_utf, StandardCharsets.ISO_8859_1);
String utfGbkLine = new String(bytes_utf, "gbk");
// 使用iso编码, 使用utf8, gbk 进行解码
String isoUtfLine = new String(bytes_iso, StandardCharsets.UTF_8);
String isoGbkLine = new String(bytes_iso, "gbk");
// 使用gbk编码, 使用iso, utf8 进行解码
String gbkIsoLine = new String(bytes_gbk, StandardCharsets.ISO_8859_1);
String gbkUtfLine = new String(bytes_gbk, StandardCharsets.UTF_8);
System.out.println("-------------------");
System.out.println(utfIsoLine);
System.out.println(utfGbkLine);
System.out.println(isoUtfLine);
System.out.println(isoGbkLine);
System.out.println(gbkIsoLine);
System.out.println(gbkUtfLine);
System.out.println("*******************");
System.out.println("看下是否能够还原");
String isoUtfLineR = new String(utfIsoLine.getBytes(StandardCharsets.ISO_8859_1), StandardCharsets.UTF_8);
String gbkUtfLineR = new String(utfGbkLine.getBytes("gbk"), StandardCharsets.UTF_8);
String utfIsoLineR = new String(isoUtfLine.getBytes(StandardCharsets.UTF_8), StandardCharsets.ISO_8859_1);
String gbkIsoLineR = new String(isoGbkLine.getBytes("gbk"), StandardCharsets.ISO_8859_1);
String isoGbkLineR = new String(gbkIsoLine.getBytes(StandardCharsets.ISO_8859_1), "gbk");
String utfGbkLineR = new String(gbkUtfLine.getBytes(StandardCharsets.UTF_8), "gbk");
System.out.println("使用utf8编码, 使用iso解码, 使用iso编码, 使用utf8解码 还原成 "+isoUtfLineR);
System.out.println("使用utf8编码, 使用gbk解码, 使用gbk编码, 使用utf8解码 还原成 "+gbkUtfLineR);
System.out.println("使用iso编码, 使用utf8解码, 使用utf8编码, 使用iso解码 还原成 "+utfIsoLineR);
System.out.println("使用iso编码, 使用gbk解码, 使用gbk编码, 使用iso解码 还原成 "+gbkIsoLineR);
System.out.println("使用gbk编码, 使用iso解码, 使用iso编码, 使用gbk解码 还原成 "+isoGbkLineR);
System.out.println("使用gbk编码, 使用utf8解码, 使用utf8编码, 使用gbk解码 还原成 "+utfGbkLineR);
/**
* 得出以下结论:
* 使用utf8编码, 使用iso解码, 使用iso编码, 使用utf8解码 还原成 老丑
使用utf8编码, 使用gbk解码, 使用gbk编码, 使用utf8解码 还原成 老丑
使用iso编码, 使用utf8解码, 使用utf8编码, 使用iso解码 还原成 ??
使用iso编码, 使用gbk解码, 使用gbk编码, 使用iso解码 还原成 ??
使用gbk编码, 使用iso解码, 使用iso编码, 使用gbk解码 还原成 老丑
使用gbk编码, 使用utf8解码, 使用utf8编码, 使用gbk解码 还原成 锟较筹拷
* utf-8编码可以用gbk和iso8859-1解码后编回去 gbk编码后只能用iso8859-1解码后编回去
*/
}
public static void main(String[] args) throws UnsupportedEncodingException {
String line = "老丑";
ISOToUTF8(line);
}
}
以上就是所有代码, 有错误还希望指出, 谢谢啦