URL编码的原因及场景

最新推荐文章于 2025-03-26 17:20:05 发布

houqicun

最新推荐文章于 2025-03-26 17:20:05 发布

阅读量4k

点赞数 1

分类专栏： javaweb 文章标签： url 编码

本文链接：https://blog.csdn.net/houqicun/article/details/78296886

版权

javaweb 专栏收录该内容

0 篇文章

订阅专栏

URL编码的原因及场景

一般开发中，如果一个东西需要被编码，其原因有多种：由于私密信息传输需要被编码、由于传输时内容过大需要编码压缩等等；

而URL编码则是为了解决url中可能存在的字符歧义。

网络标准RFC 1738做了如下规定：

　　"...Only alphanumerics [0-9a-zA-Z], the special characters "$-_.+!*'()," [not including the quotes - ed], 
　　and reserved characters used for their reserved purposes may be used unencoded within a URL."

　　“只有字母和数字[0-9a-zA-Z]、一些特殊符号“$-_.+!*’(),”[不包括双引号]、以及某些保留字，才可以不经过编码直接用于URL。”

1.url路径中存在中文参数时

如下面的url路径

www.baidu.com?id=123&name=中文

对于Unicode字符，RFC文档建议使用utf-8对其进行编码得到相应的字节，然后对每个字节执行百分号编码。如”中文”使用UTF-8字符集得到的字节为0xE4 0xB8 0xAD 0xE6 0x96 0x87，经过Url编码之后得到”%E4%B8%AD%E6%96%87”。或是在程序中使用专门的UrlEncode编码；

正确的带中文内容路径的访问方式如下：

www.baidu.com?id=123&name=%E4%B8%AD%E6%96%87

2.url路径中带有特殊符号

某些特殊符号在url中会产生歧义

序号	特殊字符	含义	十六进制值
1	+	URL 中+号表示空格	%2B
2	空格	URL中的空格可以用+号或者编码	%20
3	/	分隔目录和子目录	%2F
4	?	分隔实际的 URL 和参数	%3F
5	%	指定特殊字符	%25
6	#	表示书签	%23
7	&	URL 中指定的参数间的分隔符	%26
8	=	URL 中指定参数的值	%3D