encodeURI为什么要用两次

转载地址:http://blog.csdn.net/doymm2008/article/details/6570217

首先说下JS中encodeURIencodeURIComponent的区别

encodeURI会忽略host部分和url合法字符如/#.,encodeURIComponent则全部编码。
var url = "keleyi.com/a/a.b /c?ss=2&b=0#ss%s";
encodeURI = keleyi.com/a/a.b%20/c?ss=2&b=0#ss%25s (编码了空格和%)
encodeURIComponent = keleyi.com%2Fa%2Fa.b%20%2Fc%3Fss%3D2%26b%3D0%23ss%25s (除了“点”全部编码)

实例

在本例中,我们将使用 encodeURI() 对 URI 进行编码:

<script type="text/javascript">

document.write(encodeURI("http://www.w3school.com.cn")+ "<br />")
document.write(encodeURI("http://www.w3school.com.cn/My first/"))
document.write(encodeURI(",/?:@&=+$#"))

</script>

输出:

http://www.w3school.com.cn
http://www.w3school.com.cn/My%20first/
,/?:@&=+$#


实例

在本例中,我们将使用 encodeURIComponent() 对 URI 进行编码:

<script type="text/javascript">

document.write(encodeURIComponent("http://www.w3school.com.cn"))
document.write("<br />")
document.write(encodeURIComponent("http://www.w3school.com.cn/p 1/"))
document.write("<br />")
document.write(encodeURIComponent(",/?:@&=+$#"))

</script>

输出:

http%3A%2F%2Fwww.w3school.com.cn
http%3A%2F%2Fwww.w3school.com.cn%2Fp%201%2F
%2C%2F%3F%3A%40%26%3D%2B%24%23


一般情况下, 发送 encodeURIComponent(parmeName)+"="+encodeURIComponent(parmeValue);

接收时, 直接 String paramValue = request.getParameter(paramName); // 容器自动解码.

我们知道 encodeURIComponent 使用的是 UTF-8 编码规则来编的.
如果 request.getParameter(paramName) 时,容器也按 UTF-8 解的话,是正确的. 根本无须在客户端
进行二次的 encodeURIComponent(...)


如果 request.getParameter(paramName),容器没有按 UTF-8 解的话, 结果只有一个,就是 乱码 !
容器按什么编码来解码,决定于 request.setCharacterEncoding(***) 或者 服务器程序配置.

如果你在 jsp 程序中,能够 request.setCharacterEncoding("UTF-8"), 并且 修改服务器配置,让容器在解 GET 提交的参数时,使用 UTF-8.

客户端提交前不用二次编码, 接收时,也只要直接 request.getParameter(paramName) 即可

---------------------

为什么网上会有人提出在客户端对字符串重复编码两次呢.
如果因为项目需要,不能指定容器使用何种编码规则来解码提交的参数, 比如:需要接收来自不同页面,不地编码的参数内容时。 (又或者是开发人员被这有点复杂的东东搞得晕头转向,不懂得如何正确的去做好这接收参数的工作)
这个时候,在客户端对参数进行二次编码,可以有效的 避开 提交多字节字符 ”的这个棘手问题。
因为第一次编码,你的参数内容便不带有多字节字符了,成了纯粹的 Ascii 字符串。(这里把编第一次的结果叫成 [ STR_ENC1 ] 好了。[STR_ENC1] 是不带有多字节字符的)
再编一次后,提交,接收时容器自动解一次 (容器自动解的这一次,不管是按 GBK 还是 UTF-8 还是 ISO-8859-1 都好,都能够正确的得到 [STR_ENC1])

然后,再在程序中实现一次 decodeURIComponent (Java中通常使用 java.net.URLDecoder(***, "UTF-8")) 就可以得到想提交的参数的原值。


下面是我自己试验的:

 <Connector port="8083" protocol="HTTP/1.1"
               connectionTimeout="20000"
               redirectPort="8443" URIEncoding="UTF-8"/>

如果你在tomcat的conf/server.xml中的connector标签中,指定了【URIEncoding="UTF-8"】编码(上面配置标红的地方),那么你在前端JSP界面,可以不用encodeURI方法编码就能在Controller(控制层)获取正确的参数。

如果你在tomcat中没有指定,那就得在前端JSP界面js中调用两次encodURI方法,在后台调用URLDecoder类的decode(String s, String enc)方法才能得到正确的参数。


转载地址:http://www.cnblogs.com/syxchina/archive/2011/11/15/2249690.html

本来以为把jsp页面设置为UTF-8,服务器端用filter把request和response设置为utf-8,中文问题应该就差不多了。

但tomcat似乎中间给我我们加了步骤。

1 页面

页面中设置的编码,我们post的数据就会按照页面的编码进行 encode,

比如 我们要post数据为 site=博客园,如果我们的页面为utf-8格式,

则实际post的数据为 site=%E5%8D%9A%E5%AE%A2%E5%9B%AD

java:URLEncoder.encode("博客园", "utf-8"),

所以我们post给服务器的数据会先经过页面编码的encode。

2 tomcat服务器

当我们直接 request.getParameter(“site”);发现得到的字符串为“?????????”,

因为tomcat自作聪明的把的字符串当成iso8859-1来解码了,

tomcat执行了类似:URLDecoder.decode(str, "iso8859-1");,因为jsp页面默认的编码就是iso8859-1,

就算你改了myeclipse的jsp页面默认编码,但tomcat的还是iso8859-1。

3 servlet

我们的servlet如何得到中文编码呢?我们一步一步的加码解码即可:

URLEncoder.encode(str, "iso8859-1");//把tomcat给我们解码的字符串给加码上

URLDecoder.decode(str, "utf-8");//把浏览器给我们加码的数据解码

 

总体过程:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
//页面 pageEncoding=utf-8
String str = "博客园" ;
str = URLEncoder.encode(str, "utf-8" );
System.out.println(str);
//output:%E5%8D%9A%E5%AE%A2%E5%9B%AD
 
//tomcat
str = URLDecoder.decode(str, "iso8859-1" );
System.out.println(str);
//output:?????????
 
// servlet
str = URLEncoder.encode(str, "iso8859-1" );
System.out.println(str); //%E5%8D%9A%E5%AE%A2%E5%9B%AD
str = URLDecoder.decode(str, "utf-8" );
System.out.println(str); //博客园

 

知道了tomcat加码解码过程,我们就可以彻底设置解码方式了。

如果是get方式传数据,可以设置解码方式,

在tomcat的server.xml中 connector加上解码方式:

1
2
3
<Connector port= "8000"  protocol= "HTTP/1.1"  URIEncoding= "UTF-8"
            connectionTimeout= "20000"
            redirectPort= "8443"  />

post还是使用filter + 手动解码吧!




  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值