最近在学JSP,在学习处理get方式提交数据出现乱码问题的时候,对其中的一个解决方法new String(s.getBytes("iso-8859-1"),"utf-8");产生了疑问,就是为什么要使用s.getBytes("iso-8859-1")?
当时只这样想的:客户端向服务器发送一个请求,比如说是一个字符串"请求";之后服务器接收到这个请求,也就是这个字符串,可是这时由于某种原因出现了乱码!这时为了解决这个问题,使用new String(s.getBytes("iso-8859-1"),"utf-8");解决问题。看到这条语句,我感觉想不通啊,字符使用iso-8859-1编码取得字节序列,再由utf-8解码取得字符串,得到的还是乱码啊!怎么会取得正确的字符呢!!!想不通啊!
之后,通过查找资料,得到了一点想法,代码如下:
1 public class ThinkIng { 2 public static void main(String[] args) throws Exception { 3 System.out.println("\t------JSP模拟------"); 4 System.out.println("客户端,有一个中文字符的请求(转换成了字节序列发送),发送至服务器端"); 5 String request="请求"; 6 byte[] client=request.getBytes();//客户端的请求的字节序列 7 print(client); 8 System.out.println();//分割用的 9 System.out.println("有一中间件,将发送的字符序列一默认的编码格式(iso-8859-1)进行解码"); 10 String sever=new String(client,"iso-8859-1"); 11 System.out.println(sever); 12 System.out.println("程序猿发现,这边有问题,中文有乱码,前来解决!"); 13 String debug=new String(sever.getBytes("iso-8859-1"),"gbk");//还原字节序列,使用“gbk”重新进行解码! 14 System.out.println(debug); 15 System.out.println("问题解决!"); 16 } 17 public static void print(byte[] b){//用于显示字节序列的 18 for(byte b1:b){ 19 System.out.print(Integer.toHexString(b1 & 0xff)+" "); 20 } 21 } 22 }
先前没有想通主要是自己没注意到:
- 没有着重的想为什么会在输出时出现字符乱码?
- 客户端发送求时,字符转换成字节序列时的编码方式是什么样的?
总的来说,乱码是由于编码方式与解码方式不一致导致的,这一句话没有理解透!如果当时这样想既然出现了乱码,肯定是那边的编码格式和解码格式不一致,就好了!
注:编码:将字符串转换成字节序列;解码:将字节序列转换成字符串
感谢:http://liguocai2009.iteye.com/blog/1602256这篇文章给我的启发!