1 背景
在工作中会发现一些职场老鸟也不能很好地处理项目中的字符编解码问题,这个看似简单的问题,但是由于理解没有足够精确,在处理的时候含糊不清,埋下一定的隐患。以下列举了根据实际工作中遇见的情况提取并改编简化的案例,如果读者对这些案例中的问题没有清晰肯定的解决方案,那么建议花一些时间了解下本文,本文会结合这些案例来剖析其背后的深层机制。
案例一
String str = "hello你好";
byte [] utf8 = str.getBytes("utf-8");
byte [] gbk = str.getBytes("gbk");
byte [] unicode = str.getBytes("Unicode");
byte [] hash = DigestUtils.sha256(utf8);
System.out.println("utf-8: " + Hex.encodeHexString(utf8));
System.out.println("gbk: " + Hex.encodeHexString(gbk));
System.out.println("unicode: " + Hex.encodeHexString(unicode));
System.out.println("utf-8base64: " + Base64.encodeBase64String(utf8));
System.out.println("hash: " + Base64.encodeBase64String(hash))