本文主要参考了以下书籍,第三章 深入分析java web 中的中文编码问题,如果已经看了这本书,基本可以不用看这篇文章了,当然如果搜到这个文章,说明你应该也没看这本书,^_^:
**
一、介绍
**
URL几个组成部分:
html 中设置字符集的地方:
Tomcat server.xml 配置文件中 URIEncoding 和 useBodyEncodingForURI:
二、编码问题
一次http请求的示意图:
1、下面分别讲下四个步骤中数据编码、解码过程,序号对应不同的步骤,其中 >代表的是选择编码集的优先级:
① 、
URI使用utf-8进行编码
一、 表单get、post请求
URL中QueryString 部分使用(html meta中的charset> 系统默认编码集)
二、 ajax get请求
URL 中的参数,各个浏览器编码不同(比如火狐用utf-8, IE 用系统默认编码),这时候参数如果有中文,为保障没有乱码,需要先自己手动进行编码(escape()、 encodeURI()、encodeURIComponent() 具体用法参考附录),服务器解码后,自己再手动解码一次。
建议用 encodeURIComponent(),因为它对应java服务端的 URLEncoder
三、ajax post请求
默认都用utf-8,所以相对于ajax get 请求,更建议使用ajax post 请求
②
对URI解码(> ISO-8895-1) 前提是在tomcat中配置了
请求头信息 中的 cookie。redirectPath 等,解码是(请求头信息中 ContentType中的charset >ISO-8895-1)
一、Get请求
QueryString 解码 (请求头信息 中 ContentType中的charset > ISO-8895-1) 前提是tomcat中配置了
二、 Post请求
QueryString解码(request.setCharacterEncoding(charset) > 请求头信息中 ContentType中的charset> 系统默认的编码),所以post请求一般不会出现乱码问题
③ 、
返回内容编码(response.setCharacterEncoding(charset) >系统默认编码集)
response.setCharacterEncoding(charset) 设置了返回内容的编解码字符集
④ 、
浏览器解码(返回头信息 中 ContentType中的charset > html的meta中的charset >系统默认编码)
2、如下场景需要特别注意参数中的 + &
这时候传到后台的数据会有丢失部分参数。
解决办法http://blog.csdn.net/xiaoshuji/article/details/51353972
3、附录:
4、js的encodeURIComponent与java的URLEncoder的区别
http://onedear.iteye.com/blog/1727920
三、总结:
应通过以下方式360度去除乱码的问题,以utf-8举例,建议使用该编码集:
1、页面中统一设置
<meta http-equiv="content-Type" content="text/html;charset=UTF-8">
2、tomcat server.xml 中配置
3、框架中使用filter 对所有请求设置如下,注意在request.getParameter 方法调用前设置:
request.setCharacterEncoding("utf-8");