java字符串编码和解码
记录原因:因为Windows和Linux操作系统默认编码的不同( Windows的默认编码为GBK,Linux的默认编码为UTF-8),导致项目中出现了乱码问题,故此记录一下。
万变不离其宗,只要保证编码方式和解码方式统一,你就不可能出现乱码。
(代码中getBytes()默认系统编码获得是"utf-8"原因是我开发环境中设置的默认系统编码是“utf-8”!)
getBytes() 编码 new String(byte[], decode) 解码
与getBytes()相对的,通过new String(byte[], decode)的方式来还原。
但发现ISO8859-1编码再组合之后,无法还原“好”字呢,其实原因很简单,因为ISO8859-1编码的编码表中,根本就没有包含汉字字符,所以解码还原就无从谈起。
注意:
但有时候,为了让中文字符适应某些特殊要求(如httpheader要求其内容必须为iso8859-1编码),可能会通过将中文字符按照字节方式来编码的情况,如:
String s_iso88591 = newString(“好”.getBytes(“UTF-8”),“ISO8859-1”)
String s_utf8 = newString(s_iso88591.getBytes(“ISO8859-1”),“UTF-8”)
String s_iso88591 = newString("好".getBytes("UTF-8"),"ISO8859-1")
第一步: "好".getBytes("UTF-8"):把"好"用utf-8编码取得字节
第二步: new String(xxx字节,""ISO8859-1""):以"ISO8859-1"的编码生成字符串
String s_utf8 = newString(s_iso88591.getBytes("ISO8859-1"),"UTF-8")
第一步:s_iso88591.getBytes("UTF-8"):把s_iso88591用"ISO8859-1"编码取得字节
第二步:new String(xxx字节,"UTF-8"):以”UTF-8”的编码生成字符串
这样就既保证了遵守协议规定使用ISO8859-1、也支持了中文。