url中空格的编码

最新推荐文章于 2024-06-06 15:48:10 发布

ViancaChen

最新推荐文章于 2024-06-06 15:48:10 发布

阅读量1.3k

点赞数

分类专栏：前端基础知识文章标签： url

原文链接：https://muchstudy.com/2017/12/06/%E5%AD%97%E7%AC%A6%E8%A7%A3%E7%A0%81%E6%97%B6%E5%8A%A0%E5%8F%B7%E8%A7%A3%E7%A0%81%E4%B8%BA%E7%A9%BA%E6%A0%BC%E9%97%AE%E9%A2%98%E6%8E%A2%E7%A9%B6/

版权

前端基础知识专栏收录该内容

6 篇文章 0 订阅

订阅专栏

为什么有的url编码会将空格编成+而有的会编成%20
造成这种混乱局面的原因在于：

W3C标准规定，当Content-Type为application/x-www-form-urlencoded时，URL中查询参数名和参数值中空格要用加号+替代，所以几乎所有使用该规范的浏览器在表单提交后，URL查询参数中空格都会被编成加号+。

而在另一份规范(RFC 2396，定义URI)里, URI里的保留字符都需转义成%HH格式(Section 3.4 Query Component)，因此空格会被编码成%20，加号+本身也作为保留字而被编成%2B，对于某些遵循RFC 2396标准的应用来说，它可能不接受查询字符串中出现加号+，认为它是非法字符。所以一个安全的举措是URL中统一使用%20来编码空格字符。

Java中的URLEncoder本意是用来把字符串编码成application/x-www-form-urlencoded MIME格式字符串，也就是说仅仅适用于URL中的查询字符串部分，但是URLEncoder经常被用来对URL的其他部分编码，它的encode方法会把空格编成加号+，与之对应的是，URLDecoder的decode方法会把加号+和%20都解码为空格，这种违反直觉的做法造成了当初我对空格URL编码问题的困扰。

笨方法：在调用URLEncoder.encode对URL进行编码后(所有加号+已被编码成%2B)，再调用replaceAll(“+”, “%20″)，将所有加号+替换为%20。

推荐方法：
Java解决方法：encodeURIComponent 默认为采用UTF-8 字符集
URLEncoder.encode(string,“UTF-8”);

.net解决方法：https://docs.microsoft.com/zh-cn/dotnet/api/system.web.httputility.urlencode?view=netframework-4.8

为什么需要Url 编码

Url 中有些字符会引起歧义 , =,& 号等
Url 的编码格式采用的是ASCII 码，而不是Unicode ，这也就是说你不能在Url 中包含任何非ASCII 字符，例如中文

哪些字符需要编码
RFC3986 文档规定，Url 中只允许包含英文字母（a-zA-Z ）、数字（0-9 ）、-_.~4 个特殊字符以及所有保留字符。
Url 可以划分成若干个组件，协议、主机、路径等。RFC3986 中指定了以下字符为保留字符：　! * ’ ( ) ; : @ & = + $ , / ? # [ ]

参考文档

ViancaChen

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
url中空格的编码

为什么有的url编码会将空格编成+而有的会编成%20造成这种混乱局面的原因在于：W3C标准规定，当Content-Type为application/x-www-form-urlencoded时，URL中查询参数名和参数值中空格要用加号+替代，所以几乎所有使用该规范的浏览器在表单提交后，URL查询参数中空格都会被编成加号+。而在另一份规范(RFC 2396，定义URI)里, URI里的保留字符...
复制链接

扫一扫

专栏目录