响应中乱码
所谓响应中的乱码,就是显示页面上的乱码,因为页面数据是从服务器一端放入响应(response)中,然后发送给浏览器,如果响应中的数据无法被正常解析,就会出现乱码问题。
为了获得正常显示的中文,需要注意以下几步:
-
因为服务器要先从本地读取jsp文件,然后经过处理后写入响应,所以我们首先要知道的就是jsp文件的编码格式。
-
我们要在http的响应(response)中添加编码信息,使用如下方式:
<%@ page contentType="text/html; charset=gb2312"%>
这段要放在jsp页面的第一行,用来指定响应的类型和编码格式,contentType为text/html就是html内容,charset表示编码为gb2312。这种<%@ %>的形式叫做jsp指令(directive),现在接触到的是page指令,还有include和taglib指令。
-
还需要在html中指定编码格式。
<head> <meta http-equiv="Content-Type" content="text/html; charset=gb2312" /> <title>title</title> </head>
meta部分用来指定当前html的编码格式,注意这一段要放在head标签中,并且放到head标签的最前面,如果不是最前面IE下可能会出现问题,尤其是在title中有中文的情况下。
完成了以上三段检验,我们才能保证输出的jsp页面会正常显示中文。
POST乱码
jsp页面中form里加上method="POST",就是让form提交的时候使用POST方式。POST方式下提交的数据都是以二进制的方式附加在http请求的body部分发送,只需要在后台指定编码格式就足矣解决。这里POST方式发送请求的时候,使用的编码是iso-8859-1。这个限制是因为当初指定http标准的成员都来自英语国家,所以如果使用默认的方式从请求获取数据,中文一定会全部变成乱码。
解决方法是在sp最前面加上一条java语句,设置请求的字符编码。
<% request.setCharacterEncoding("gb2312"); %>
GET乱码
GET方式下会将参数直接附加到url后面,这部分参数无法使用request.setCharacterEncoding()处理,结果就是get形式的所有中文都变成了乱码。
这时候只能对这些中文一个一个进行转换,使用new String(bytes, "gb2312")进行转码。
<% String username = request.getParameter("username"); byte[] bytes = username.getBytes("iso-8859-1"); String result = new String(bytes, "gb2312"); out.print(result); %>
先从request中获得参数,接着把字符串按照iso-8859-1编码打散成byte数组,然后用gb2312编码组合成新字符串,最后打印出来就是正常的中文了。