【摘记】URI 编码和解码

最新推荐文章于 2022-04-19 17:57:35 发布

尹若轩

最新推荐文章于 2022-04-19 17:57:35 发布

阅读量875

点赞数

分类专栏：基本编程

本文链接：https://blog.csdn.net/yinxiangbing/article/details/49489883

版权

基本编程专栏收录该内容

2 篇文章 0 订阅

订阅专栏

URI 编码和解码

有效的URI（统一资源标示符）是不能包含某些字符的，如空格，所以需要进行编码，编码方法有：encodeURI（）和encodeURIComponent（），
对编的码进行解码方法有：decodeURI（）和decodeURIComponent（）。
encodeURI（）编的码只能decodeURI（）解
encodeURIComponent（）编的码只能decodeURIComponent（）解，
encodeURI（）：用于编码完整的URI，它不对URI中的特殊字符进行编码：例如冒号、前斜杠、问号、英镑符号
var str0=encodeURI("http://www.cnblogs.com/ 2012/ 71.html");
结果：http://www.cnblogs.com/%202012/%2071.html
只对空格进行了编码
encodeURIComponent（）：用于编码URI的某一部分，它对URI中的所有非标准字符进行编码
var str1=encodeURIComponent("http://www.cnblogs.com/ 2012/ 71.html");
结果：http%3A%2F%2Fwww.cnblogs.com%2F%202012%2F%2071.html
对所有非标准字符进行编码

js/java 页面url传值中文编码&解码问题

地址栏中出现汉字的情况有两种，一种是汉字出现在URL的路径部分，一种是汉字出现在URL的传参的部分。

　　第二种情况的时候必须采用编码后传参，接受时解码的方式完成传参。

　　js中编码有escape(), encodeURI(),
encodeURIComponent()三个常用的方法。escape()常常用在提交页面和处理页面的编码格式相同的情况下(比如它们都是GB2312)，encodeURI()和encodeURIComponent()的用法基本相同，区别在于encodeURIComponent()也对"?"等特殊字符进行编码。

　　一开始遇到中文参数的时候，使用encodeURI()进行了一遍编码，传过去后，发现解码出现问题，于是想到可能是编码方法使用错误，于是使用escape()方法，这时发现解码时抛出isHexDigit异常。借助百度搜索isHexDigit异常，发现原来，是escape()方法造成了异常，同时了解了浏览器传递地址的一些原理，在浏览器地址栏里，浏览器认为%是个转义字符，浏览器会把%与%之间的编码，两位两位取出后进行解码,然后再传递给处理页面，然后由处理页面进行再次解码。由此我想到一直使用encodeURI方法是正确的，只是需要使用两次encodeURI方法，例如encodeURI(encodeURI("中文"));第一次是把中文编码成%xy的格式，
第二次是对%xy中的%进行编码,%编码成%。整个传参过程大体应该是：提交页面使用encodeURI(encodeURI("中文"))编码,把最后的编码结果%xy传递给处理页面的过程中，浏览器获取URL地址(注意
openModelDialog方法，浏览器获取不到参数编码)后解码成%xy，然后把%xy传递给处理页面,处理页面使用

　　URLDecoder.decode(request.getParameter("参数名"),"UTF-8");完成解码。

　　总结：

　　1、汉字出现在URL路径部分的时候不需要编码解码;

　　2、使用encodeURI进行2次编码;

　　3、在openModelDialog()打开的模式窗体里没办法用request.getParameter正确获取参数;

　　客户端和服务器在传递数据时可以用过滤器filter解决字符编码问题，但filter只能解决post方式提交的数据。对于get方式，可以使用两次encodeURI(encodeURI(“中文”))并在服务器中使用URLDecoder.decode(“中文”,
"UTF-8");

　　今天用Ajax校验数据时也遇到这个问题，尽管页面、类和web容器都统一了字符编码，提交的数据依然是乱码，所以就采用了2次encodeURI()编码方式，乱码问题就解决了。

　　在页面中：

　　/exportExcel.topinfo?ls="+encodeURI(encodeURI(_tmplsgx))+"&zt="+encodeURI(encodeURI(_tmpzt))

　　在action中

　　String ls=request.getParameter("ls");

　　ls = new String(ls.getBytes("iso-8859-1"),"utf-8");

　　ls = java.net.URLDecoder.decode(ls,"UTF-8");

　　这样乱码就解决了。