encodeURI为什么要用两次

最新推荐文章于 2021-09-27 11:30:51 发布

beijixingtianyake

最新推荐文章于 2021-09-27 11:30:51 发布

阅读量1.7k

点赞数

分类专栏： web 文章标签： java URLEncode 编码 tomcat

web 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

转载地址：http://blog.csdn.net/doymm2008/article/details/6570217

首先说下JS中encodeURI和encodeURIComponent的区别

encodeURI会忽略host部分和url合法字符如/#.，encodeURIComponent则全部编码。
var url = "keleyi.com/a/a.b /c?ss=2&b=0#ss%s";
encodeURI = keleyi.com/a/a.b%20/c?ss=2&b=0#ss%25s (编码了空格和%)
encodeURIComponent = keleyi.com%2Fa%2Fa.b%20%2Fc%3Fss%3D2%26b%3D0%23ss%25s （除了“点”全部编码）

实例

在本例中，我们将使用 encodeURI() 对 URI 进行编码：

<script type="text/javascript">

document.write(encodeURI("http://www.w3school.com.cn")+ "<br />")
document.write(encodeURI("http://www.w3school.com.cn/My first/"))
document.write(encodeURI(",/?:@&=+$#"))

</script>

输出：

http://www.w3school.com.cn
http://www.w3school.com.cn/My%20first/
,/?:@&=+$#

实例

在本例中，我们将使用 encodeURIComponent() 对 URI 进行编码：

<script type="text/javascript">

document.write(encodeURIComponent("http://www.w3school.com.cn"))
document.write("<br />")
document.write(encodeURIComponent("http://www.w3school.com.cn/p 1/"))
document.write("<br />")
document.write(encodeURIComponent(",/?:@&=+$#"))

</script>

输出：

http%3A%2F%2Fwww.w3school.com.cn
http%3A%2F%2Fwww.w3school.com.cn%2Fp%201%2F
%2C%2F%3F%3A%40%26%3D%2B%24%23

一般情况下, 发送 encodeURIComponent(parmeName)+"="+encodeURIComponent(parmeValue);

接收时, 直接 String paramValue = request.getParameter(paramName); // 容器自动解码.

我们知道 encodeURIComponent 使用的是 UTF-8 编码规则来编的.
如果 request.getParameter(paramName) 时,容器也按 UTF-8 解的话,是正确的. 根本无须在客户端
进行二次的 encodeURIComponent(...)

如果 request.getParameter(paramName),容器没有按 UTF-8 解的话, 结果只有一个,就是乱码 !
容器按什么编码来解码,决定于 request.setCharacterEncoding(***) 或者服务器程序配置.

如果你在 jsp 程序中,能够 request.setCharacterEncoding("UTF-8"), 并且修改服务器配置,让容器在解 GET 提交的参数时,使用 UTF-8.

客户端提交前不用二次编码, 接收时,也只要直接 request.getParameter(paramName) 即可

---------------------

为什么网上会有人提出在客户端对字符串重复编码两次呢.
如果因为项目需要,不能指定容器使用何种编码规则来解码提交的参数, 比如:需要接收来自不同页面，不地编码的参数内容时。 (又或者是开发人员被这有点复杂的东东搞得晕头转向，不懂得如何正确的去做好这接收参数的工作)
这个时候，在客户端对参数进行二次编码，可以有效的避开 “ 提交多字节字符 ”的这个棘手问题。
因为第一次编码，你的参数内容便不带有多字节字符了，成了纯粹的 Ascii 字符串。(这里把编第一次的结果叫成 [ STR_ENC1 ] 好了。[STR_ENC1] 是不带有多字节字符的)
再编一次后，提交，接收时容器自动解一次　（容器自动解的这一次，不管是按 GBK 还是 UTF-8 还是 ISO-8859-1 都好，都能够正确的得到 [STR_ENC1]）

然后，再在程序中实现一次 decodeURIComponent (Java中通常使用 java.net.URLDecoder(***, "UTF-8")) 就可以得到想提交的参数的原值。

下面是我自己试验的：

如果你在tomcat的conf/server.xml中的connector标签中，指定了【URIEncoding="UTF-8"】编码(上面配置标红的地方)，那么你在前端JSP界面，可以不用encodeURI方法编码就能在Controller（控制层）获取正确的参数。

如果你在tomcat中没有指定，那就得在前端JSP界面js中调用两次encodURI方法，在后台调用URLDecoder类的decode(String s, String enc)方法才能得到正确的参数。

转载地址：http://www.cnblogs.com/syxchina/archive/2011/11/15/2249690.html

本来以为把jsp页面设置为UTF-8，服务器端用filter把request和response设置为utf-8，中文问题应该就差不多了。

但tomcat似乎中间给我我们加了步骤。

1 页面

页面中设置的编码，我们post的数据就会按照页面的编码进行 encode，

比如我们要post数据为 site=博客园，如果我们的页面为utf-8格式，

则实际post的数据为 site=%E5%8D%9A%E5%AE%A2%E5%9B%AD

java：URLEncoder.encode("博客园", "utf-8")，

所以我们post给服务器的数据会先经过页面编码的encode。

2 tomcat服务器

当我们直接 request.getParameter(“site”);发现得到的字符串为“?????????”，

因为tomcat自作聪明的把的字符串当成iso8859-1来解码了，

tomcat执行了类似：URLDecoder.decode(str, "iso8859-1");，因为jsp页面默认的编码就是iso8859-1，

就算你改了myeclipse的jsp页面默认编码，但tomcat的还是iso8859-1。

3 servlet

我们的servlet如何得到中文编码呢？我们一步一步的加码解码即可：

URLEncoder.encode(str, "iso8859-1");//把tomcat给我们解码的字符串给加码上

URLDecoder.decode(str, "utf-8");//把浏览器给我们加码的数据解码

总体过程：

 
        //页面 pageEncoding=utf-8 
       
        String str =  
        "博客园" 
        ; 
       
        str = URLEncoder.encode(str,  
        "utf-8" 
        ); 
       
        System.out.println(str); 
       
        //output:%E5%8D%9A%E5%AE%A2%E5%9B%AD 
       
        //tomcat  
       
        str = URLDecoder.decode(str,  
        "iso8859-1" 
        ); 
       
        System.out.println(str); 
       
        //output:????????? 
       
        // servlet 
       
        str = URLEncoder.encode(str,  
        "iso8859-1" 
        ); 
       
        System.out.println(str); 
        //%E5%8D%9A%E5%AE%A2%E5%9B%AD 
       
        str = URLDecoder.decode(str,  
        "utf-8" 
        ); 
       
        System.out.println(str); 
        //博客园

知道了tomcat加码解码过程，我们就可以彻底设置解码方式了。

如果是get方式传数据，可以设置解码方式，

在tomcat的server.xml中 connector加上解码方式：

 
        <Connector port= 
        "8000"  
        protocol= 
        "HTTP/1.1"  
        URIEncoding= 
        "UTF-8" 
       
        connectionTimeout= 
        "20000" 
       
        redirectPort= 
        "8443"  
        />

post还是使用filter + 手动解码吧！

beijixingtianyake

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
encodeURI为什么要用两次

转载地址：一般情况下, 发送 encodeURIComponent(parmeName)+"="+encodeURIComponent(parmeValue);接收时, 直接 String paramValue = request.getParameter(paramName); // 容器自动解码.我们知道 encodeURIComponent 使用的是 UTF-8 编码
复制链接

扫一扫

专栏目录