JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页, 用的是contentType。
第一阶段是jsp转译(翻译)成.Java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。
pageEncoding=”UTF-8”的作用是设置JSP编译成Servlet时使用的编码。
第二阶段是从源码(.java)编译到字节码文件(.class),不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。
JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。
第三阶段是Tomcat(或其的application Container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效
contentType=”text/html;charset=UTF-8”的作用是指定服务器响应给浏览器的编码。
1.request.setCharacterEncoding(“UTF-8”)的作用是设置对客户端请求和数据库取值时的编码(设置获得数据的编码方式),不指定的话使用iso-8859-1。(只解决POST乱码)
拓展:解决GET乱码可以修改tomcat的server.xml中的 URIEncoding属性 或使用
str = new String(str.getBytes("iso-8859-1"),"utf-8")
2.response.setCharacterEncoding(“UTF-8”)的作用是指定服务器响应给浏览器的编码。(页面中取得的值)
3.response.setContentType(“text/html;charset=utf-8”)的作用是指定服务器响应给浏览器的编码。同时,浏览器也是根据这个参数来对其接收到的数据进行重新编码(或者称为解码)。如果之前使用response.setContentType设置了编码格式,则使用response.setCharacterEncoding指定的编码格式覆盖之前的设置.与response.setContentType相同的是,调用此方法,必须在getWriter执行之前或者response被提交之前.
对于发送数据,服务器按照response.setCharacterEncoding—contentType—pageEncoding的优先顺序,对要发送的数据进行编码。
Get是URL解码方式。默认解码格式是Tomcat8编码格式。所以URL解码是UTF-8,
覆盖掉了request容器解码格式
Post是实体内容解码方式。默认解码格式是request编码格式。与Tomcat8编码格式无关
tomcat服务器中Response容器默认以ISO8859-1的编码解析数据,因此如果需要在参数中解析中文,需要设置
request.setCharacterEncoding(“utf-8”);
post得到前台数据:(request容器默认是gbk格式)
request.setCharacterEncoding(“utf-8”);
System.out.println(request.getParameter(“name”));
GET得到前台数据:(不需要设置编码格式,默认是按照tomcat服务器的编码格式)
System.out.println(request.getParameter(“name”));
GET POST给前台传数据
response.setCharacterEncoding(“utf-8”);
response.getWriter().write(“我爱你”);