此方案适用于:
Tomcat 5x-8x
JDK 1.5 - 1.8
引子
我们在测试的时候经常遇到前后台文件的编码明明都一样,但get或post
到后台,或者响应数据到前台后,接受到的中文字符却都是乱码,而这个
时候如果恰巧对编码没有一定的理解那么真是一种丈二和尚摸不着头脑的感觉了。
那么就说下编解码的问题,我们知道浏览器与服务器后台之间通讯是通过
传输字节流也就是一堆0和1,所以我们浏览器就会按照你html的编码格
式(如utf-8),对照编码表将字符编码成字节流,然后再传输给后台
(servlet),所以这个时候后台就需要将其解码还原成我们需要的字符。
问题就出现在这里了。
由于主要是自己看的笔记,所以就举一个例子:html与Servlet文件格式都为UTF-8的情况。
那么怎么才能正确在后台显示中文呢。
post方法
Post的解决方法相对简单。
post的数据是存储在http协议的实体内容里的。
而HttpServletRequest提供了一个setCharacterEncoding()的方法恰恰
是”只”对请求的实体内容设置编解码格式的。
所以在获取数据之前只要:
request.setCharacterEncoding("utf-8");
我们再通过getParameter()方法获取post的内容时候就可以正确显示
了。
Get方法的解决措施
Get有所不同。
我们说了setCharacterEncoding()的方法是”只”对请求的实体内容有效。
而get方法传输的数据却是存储在请求行 ‘uri’(也可以理解为url)中的。
Tomcat服务器默认是把uri中部分的字节流直接当成”iso-8859-1”来编解码的。
我们获得get的数据一般通过通过
Stirng paramValue=request.getParameter(paramName);
来获得我们需要的数据值。
所以当然会出问题了,因为iso-8859-1不支持中文嘛。
我们这个时候只能先把得到的乱码数据手动用iso-8859-1的编码方式解
码得到字节流,然后再把字节流按照utf-8码表编码成字符,即得到我们
要的正确字符!
方法如下:
//手动解码
paramValue = paramValue.getBytes("iso-8859-1");
//再次编码
paramValue = new String(paramValue ,"utf-8");
搞定了!
这个时候控制台输出一下看到的就是中文而不是乱码了。