-
针对jsp编写表单提交出现中文乱码的问题,我在网上找了很多办法,什么换一种编码格式都不行,然后还是针对自己的代码进行修改,发现了这种方法。
-
在表单中获取数据通常用到的就是request.getPraramter("");方法,但是奈何获取的中文数据转码过后就出现了乱码现象。
-
原因分析:
String.getBytes(String decode) 方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示,如:
byte[] b_gbk = “中”.getBytes(“GBK”);
byte[] b_utf8 = “中”.getBytes(“UTF-8”);
byte[] b_iso88591 = “中”.getBytes(“ISO8859-1”);
将分别返回"中"这个汉字在GBK、UTF-8和ISO8859-1编码下的byte数组表示,此时
b_gbk的长度为2,
b_utf8的长度为3,
b_iso88591的长度为1。
而与getBytes相对的,可以通过 new String(byte[], decode) 的方式来还原这个"中"字,这个new String(byte[], decode)实际是使用指定的编码decode来将byte[]解析成字符串.
String s_gbk = new String(b_gbk,“GBK”);
String s_utf8 = new String(b_utf8,“UTF-8”);
String s_iso88591 = new String(b_iso88591,“ISO8859-1”);
通过输出s_gbk、s_utf8和s_iso88591,会发现s_gbk和s_utf8都是"中",而只有s_iso88591是一个乱码,原因很简单,因为 tomcat 中,对于以 post 方式提交的表单编码格式 默认 为 ISO-8859-1 的编码格式,而这种编码格式是不能编码中文的。所以,再通过new String()来还原就更是无从谈起。
因此,通过String.getBytes(String decode)方法来得到byte[]时,一定要确定decode的编码表中确实存在String表示的码值,这样得到的byte[]数组才能正确被还原。 -
解决方法:
在 String.getBytes(String decode) 方法中设置了转码格式后,再通过 new String(byte[], decode) 方法来将转码后的格式在转换为我们的中文格式。
public String handleStr(String s) {
byte [] bb= s.getBytes("ISO-8859-1");
s = new String(bb,"utf-8");
//等价于s=new String(s.getBytes("ISO-8859-1","utf-8"));
}
未修改前:
修改后: