转载地址:http://blog.csdn.net/doymm2008/article/details/6570217
首先说下JS中encodeURI和encodeURIComponent的区别
encodeURI会忽略host部分和url合法字符如/#.,encodeURIComponent则全部编码。
var url = "keleyi.com/a/a.b /c?ss=2&b=0#ss%s";
encodeURI = keleyi.com/a/a.b%20/c?ss=2&b=0#ss%25s (编码了空格和%)
encodeURIComponent = keleyi.com%2Fa%2Fa.b%20%2Fc%3Fss%3D2%26b%3D0%23ss%25s (除了“点”全部编码)
实例
在本例中,我们将使用 encodeURI() 对 URI 进行编码:
<script type="text/javascript"> document.write(encodeURI("http://www.w3school.com.cn")
+ "<br />") document.write(encodeURI("http://www.w3school.com.cn/My first/")
) document.write(encodeURI(",/?:@&=+$#")
) </script>
输出:
http://www.w3school.com.cn http://www.w3school.com.cn/My%20first/ ,/?:@&=+$#
实例
在本例中,我们将使用 encodeURIComponent() 对 URI 进行编码:
<script type="text/javascript"> document.write(encodeURIComponent("http://www.w3school.com.cn")) document.write("<br />") document.write(encodeURIComponent("http://www.w3school.com.cn/p 1/")) document.write("<br />") document.write(encodeURIComponent(",/?:@&=+$#")) </script>
输出:
http%3A%2F%2Fwww.w3school.com.cn http%3A%2F%2Fwww.w3school.com.cn%2Fp%201%2F %2C%2F%3F%3A%40%26%3D%2B%24%23
一般情况下, 发送 encodeURIComponent(parmeName)+"="+encodeURIComponent(parmeValue);
接收时, 直接 String paramValue = request.getParameter(paramName); // 容器自动解码.我们知道 encodeURIComponent 使用的是 UTF-8 编码规则来编的.
如果 request.getParameter(paramName) 时,容器也按 UTF-8 解的话,是正确的. 根本无须在客户端
进行二次的 encodeURIComponent(...)
如果 request.getParameter(paramName),容器没有按 UTF-8 解的话, 结果只有一个,就是 乱码 !
容器按什么编码来解码,决定于 request.setCharacterEncoding(***) 或者 服务器程序配置.
如果你在 jsp 程序中,能够 request.setCharacterEncoding("UTF-8"), 并且 修改服务器配置,让容器在解 GET 提交的参数时,使用 UTF-8.
客户端提交前不用二次编码, 接收时,也只要直接 request.getParameter(paramName) 即可
---------------------
为什么网上会有人提出在客户端对字符串重复编码两次呢.
如果因为项目需要,不能指定容器使用何种编码规则来解码提交的参数, 比如:需要接收来自不同页面,不地编码的参数内容时。 (又或者是开发人员被这有点复杂的东东搞得晕头转向,不懂得如何正确的去做好这接收参数的工作)
这个时候,在客户端对参数进行二次编码,可以有效的 避开 “ 提交多字节字符 ”的这个棘手问题。
因为第一次编码,你的参数内容便不带有多字节字符了,成了纯粹的 Ascii 字符串。(这里把编第一次的结果叫成 [ STR_ENC1 ] 好了。[STR_ENC1] 是不带有多字节字符的)
再编一次后,提交,接收时容器自动解一次 (容器自动解的这一次,不管是按 GBK 还是 UTF-8 还是 ISO-8859-1 都好,都能够正确的得到 [STR_ENC1])
然后,再在程序中实现一次 decodeURIComponent (Java中通常使用 java.net.URLDecoder(***, "UTF-8")) 就可以得到想提交的参数的原值。
下面是我自己试验的:
<Connector port="8083" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443" URIEncoding="UTF-8"/>
如果你在tomcat的conf/server.xml中的connector标签中,指定了【URIEncoding="UTF-8"】编码(上面配置标红的地方),那么你在前端JSP界面,可以不用encodeURI方法编码就能在Controller(控制层)获取正确的参数。
如果你在tomcat中没有指定,那就得在前端JSP界面js中调用两次encodURI方法,在后台调用URLDecoder类的decode(String s, String enc)方法才能得到正确的参数。
转载地址:http://www.cnblogs.com/syxchina/archive/2011/11/15/2249690.html
本来以为把jsp页面设置为UTF-8,服务器端用filter把request和response设置为utf-8,中文问题应该就差不多了。
但tomcat似乎中间给我我们加了步骤。
1 页面
页面中设置的编码,我们post的数据就会按照页面的编码进行 encode,
比如 我们要post数据为 site=博客园,如果我们的页面为utf-8格式,
则实际post的数据为 site=%E5%8D%9A%E5%AE%A2%E5%9B%AD
java:URLEncoder.encode("博客园", "utf-8"),
所以我们post给服务器的数据会先经过页面编码的encode。
2 tomcat服务器
当我们直接 request.getParameter(“site”);发现得到的字符串为“?????????”,
因为tomcat自作聪明的把的字符串当成iso8859-1来解码了,
tomcat执行了类似:URLDecoder.decode(str, "iso8859-1");,因为jsp页面默认的编码就是iso8859-1,
就算你改了myeclipse的jsp页面默认编码,但tomcat的还是iso8859-1。
3 servlet
我们的servlet如何得到中文编码呢?我们一步一步的加码解码即可:
URLEncoder.encode(str, "iso8859-1");//把tomcat给我们解码的字符串给加码上
URLDecoder.decode(str, "utf-8");//把浏览器给我们加码的数据解码
总体过程:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
//页面 pageEncoding=utf-8
String str =
"博客园"
;
str = URLEncoder.encode(str,
"utf-8"
);
System.out.println(str);
//output:%E5%8D%9A%E5%AE%A2%E5%9B%AD
//tomcat
str = URLDecoder.decode(str,
"iso8859-1"
);
System.out.println(str);
//output:?????????
// servlet
str = URLEncoder.encode(str,
"iso8859-1"
);
System.out.println(str);
//%E5%8D%9A%E5%AE%A2%E5%9B%AD
str = URLDecoder.decode(str,
"utf-8"
);
System.out.println(str);
//博客园
|
知道了tomcat加码解码过程,我们就可以彻底设置解码方式了。
如果是get方式传数据,可以设置解码方式,
在tomcat的server.xml中 connector加上解码方式:
1
2
3
|
<Connector port=
"8000"
protocol=
"HTTP/1.1"
URIEncoding=
"UTF-8"
connectionTimeout=
"20000"
redirectPort=
"8443"
/>
|
post还是使用filter + 手动解码吧!