URL 的编码和解码

最新推荐文章于 2025-03-26 17:20:05 发布

沙漠举重的萝卜

最新推荐文章于 2025-03-26 17:20:05 发布

阅读量1.3w

点赞数 13

文章标签：前端

本文链接：https://blog.csdn.net/Y2ANGAO/article/details/124279862

版权

URL 的编码和解码

1 什么是 URL？

URL（Uniform Resource Locator）：统一资源定位符，它是用来表示互联网上的某个资源地址，互联网上的每个文件都有一个唯一的 URL，它包含的信息指出文件的位置以及浏览器应该怎么处理它。

URL 一般由三部组成：

协议（或称为服务方式）。
存有该资源的主机 IP 地址（有时也包括端口号）。
主机资源的具体地址。如目录和文件名等。

// 语法格式
// protocol://hostname[:port]/path[?query][#fragment]
// 例子
// http://root@localhost:8080/appname/path?name=admin&password=666#fragment

2 为什么要进行 URL 编码？

在 URL 地址中，不允许出现非 ASCII 字符，如果 URL 地址中需要包含中文字符，就必须对中文字符进行编码（转义）。

在 URL 参数字符串中用 key=value 这种键值对的形式进行传递参数，多个键值对中间用 & 连接。如果在 value 中也存在 & 这个符号的话，不对其进行编码，就会引起歧义。

3 URL 与 URI

3.1 什么是 URI？

URI（Uniform Resource Identifier）：统一资源标识符，用来唯一的标识一个资源。Web 上可用的每种资源如 HTML 文档、图像、视频片段、程序等都是一个来 URI 来定位的。

格式如下：

// [协议名]://[用户名]:[密码]@[服务器地址]:[服务器端口号]/[路径]?[查询字符串]#[片段ID]

3.2 URL 与 URI 之间的区别及联系

URI：统一资源标识符，URL：统一资源定位符。
URI 包括 URL ，也就是说 URL 是 URI 的子集。
能唯一标识一个资源的就是 URI，在 URI 的基础上再给出其资源的访问方式的就是 URL。

4 URL 编码

3.1 escape()（已废弃）

escape() 是对字符串进行编码，不适用于 URI，其中 @*_±./ 被排除在外，不会被编码。

console.log(escape("qaqa666"));  // qaqa666
console.log(escape("你好"));  // %u4F60%u597D
console.log(escape("&&%%"));  // %26%26%25%25
console.log(escape("@*_+-./"));  // @*_+-./

注意：escape() 已经从 Web 标准中删除，这里只是作为了解，虽然现在它还在，但是说不定哪天它就没了。

我们进行 URI 编码还是要使用下面两种函数。

3.2 encodeURI() 和 encodeURIComponent()

相同点：都是对 URI 进行编码。

不同点：encodeURI 通常用于转码整个 URI，而 encodeURIComponent 主要是用来转码 URI 的组成部分（？后面的参数部分）。

3.2.1 encodeURI()

encodeURI 会替换除; , / ? : @ & = + $ - _ . ! ~ * ' ( ) #的所有的字符，如下示例：

// encodeURI() 编码
// 不编码
console.log(encodeURI(";,/?:@&=+$-_.!~*'()#"));
// 输出：;,/?:@&=+$-_.!~*'()#

console.log(encodeURI("https://hanyu.baidu.com/?id=1&name=六十六"));
// 输出：https://hanyu.baidu.com/?id=1&name=%E5%85%AD%E5%8D%81%E5%85%AD
// 六十六 被编码为了 %E5%85%AD%E5%8D%81%E5%85%AD

注意：encodeURI 自身无法产生能适用于 HTTP GET 或 POST 请求的URI，例如对于 XMLHTTPRequests，因为 “&”, “+”, 和 “=” 不会被编码，然而在 GET 和 POST 请求中它们是特殊字符。encodeURIComponent 这个方法会对这些字符编码。

3.2.2 encodeURIComponent()

encodeURIComponent 会替换除A-Z a-z 0-9 - _ . ! ~ * ' ( )的所有的字符，如下示例：

//encodeURIComponent 编码
// 不编码
console.log(encodeURIComponent("A-Za-z0-9-_.!~*'()"));
// 输出：A-Za-z0-9-_.!~*'()

// 错误用法，不能直接将整个 URI 进行编码
console.log(encodeURIComponent("https://hanyu.baidu.com/?name=六十六"));
// 输出：https%3A%2F%2Fhanyu.baidu.com%2F%3Fname%3D%E5%85%AD%E5%8D%81%E5%85%AD
// 可以看到 ：/ 都被编码了

// 正确用法，只对单个参数进行编码
console.log("https://hanyu.baidu.com/?name=" + encodeURIComponent("六十六"));
// 输出：https://hanyu.baidu.com/?name=%E5%85%AD%E5%8D%81%E5%85%AD

为了避免服务器收到不可预知的请求，对任何用户输入的作为 URI 部分的内容都需要用 encodeURIComponent 进行转义，示例如下：

// "https://hanyu.baidu.com/?type=a&name=你好"
// 对于上面这串字符串，key 为 type，而 value 为 a&name=你好，如果我们不用 encodeURIComponent 编码，那么将会出现如下结果
console.log(encodeURI("https://hanyu.baidu.com/?type=a&name=你好"));
// 输出：https://hanyu.baidu.com/?type=a&name=%E4%BD%A0%E5%A5%BD
// 如果服务器端收到数据，这将会变为两个参数，就会引发歧义，所以需要用 encodeURIComponent 进行编码
console.log("https://hanyu.baidu.com/?type=" + encodeURIComponent("a&name=你好"));
// 输出：https://hanyu.baidu.com/?type=a%26name%3D%E4%BD%A0%E5%A5%BD
// 通过对比可以看到 & 被编码为了 %26，这样就能有效解决歧义

5 URL 解码

4.1 unescape()（已废弃）

unescape() 就是将被编码过的字符串重新计算生成，与上文所述的 escape() 对应，这也是已经废弃的函数。

console.log(unescape("qaqa666"));  // qaqa666
console.log(unescape("%u4F60%u597D"));  // 你好
console.log(unescape("%26%26%25%25"));  // &&%
console.log(unescape("@*_+-./"));  // @*_+-./

4.2 decodeURI()

decodeURI 就是将被 encodeURI 编码过的 URI 解码为未编码版本的新字符串。

注意：decodeURI 不能解码那些不会被 encodeURI 编码的内容（例如 "& = + $ #"）。

// decodeURI 解码
// 不解码
console.log(decodeURI("&=+$#"));
// 输出：&=+$#

console.log(decodeURI("https://hanyu.baidu.com/?id=1&name=%E5%85%AD%E5%8D%81%E5%85%AD"));
// 输出：https://hanyu.baidu.com/?id=1&name=六十六
// %E5%85%AD%E5%8D%81%E5%85%AD 被解码为了 六十六

4.3 decodeURIComponent()

decodeURIComponent() 就是将被 encodeURIComponent() 编码过的部分 URI 解码为一个统一资源标识符（URI）字符串，处理前的 URI 经过了给定格式的编码。

同样，decodeURIComponent 也不能解码那些不会被 encodeURIComponent 编码的内容。

// decodeURIComponent 解码
// 不解码
console.log(decodeURIComponent("A-Za-z0-9-_.!~*'()"));
// 输出：A-Za-z0-9-_.!~*'()

console.log("https://hanyu.baidu.com/?type=" + decodeURIComponent("a%26name%3D%E4%BD%A0%E5%A5%BD"));
// 输出：https://hanyu.baidu.com/?type=a&name=你好