atob、btoa 和 encodeURIComponent

mx_2022

于 2024-12-30 11:18:06 发布

阅读量2k

点赞数 30

CC 4.0 BY-SA版权

文章标签：笔记

本文链接：https://blog.csdn.net/mx_2022/article/details/144747546

在前后端数据传输过程中，atob、btoa 和 encodeURIComponent 是常用的编码工具，分别用于不同场景，以下是它们的特点和适用情况：

1. `atob` 和 `btoa`

btoa（binary-to-ASCII）函数的作用是将一个ASCII 字符串编码成 Base64 字符串
ASCII 字符串指的是仅包含 ASCII 编码字符的字符串，这些字符的编码值在 0 到 127 范围内。
btoa 只支持 ASCII 字符，因此如果字符串包含非 ASCII 字符（如中文或表情符号等），则需要先将其转换为符合 ASCII 字符集的格式（通常通过encodeURIComponent 或其他编码方式）。
atob（ASCII-to-binary）函数的作用是将一个 Base64 编码的字符串解码为原始的 ASCII 字符串。
这个过程是将 Base64 编码的数据转回成它的原始文本表示形式，通常是一个包含 ASCII 字符的字符串。
encodeURIComponent 会将非 ASCII 字符（如中文、表情符号）和部分特殊字符编码成 % 开头的百分比编码(最终还是ASCII 字符串!!!!!)

功能：
- atob：将 Base64 编码的字符串解码为原始的ASCII 字符串。
- btoa：将ASCII 字符串编码为 Base64 字符串。
适用场景：
- 处理二进制数据（如图像、文件）以适应基于文本传输的协议（如 HTTP）。
- 在前后端之间传递较小的二进制数据或加密数据。
注意事项：
- 不支持 Unicode 字符，直接处理非 ASCII 字符会导致乱码。
- 对于非 ASCII 数据，需要先通过编码处理后再使用 btoa。

2. `encodeURIComponent`

功能：
- 对字符串进行 URI 编码，将特殊字符（如 @, /, ?, = 等）转义为 %XX 格式，以便在 URL 中安全传递。
- 简单来说，encodeURIComponent 会将非 ASCII 字符（如中文、表情符号）和部分特殊字符编码成 % 开头的百分比编码（确保所有字符都是ASCII,之后才能用 btoa 编码）
适用场景：
- URL 参数编码，确保数据在 HTTP 请求中不会因特殊字符而破坏格式。
- 在查询字符串或路径中传递包含特殊字符的参数。
注意事项：
- 不编码通用的 URI 保留字符（如 :、/ 等）。
- 用于处理前后端通过 URL 或 Query 参数传递的内容。

示例：

const param = 'Hello, World!';
const encoded = encodeURIComponent(param);
console.log(encoded); // 输出：Hello%2C%20World%21

// 解码
const decoded = decodeURIComponent(encoded);
console.log(decoded); // 输出：Hello, World!

前后端传输过程中的配合

Base64（btoa / atob）：
- 用于编码和解码较小的 ASCII 字符串数据或特定的文本数据。
- 示例：
  - 前端使用 btoa 编码文件内容。
  - 后端收到数据后通过语言相应的 Base64 解码工具（如 Buffer.from）解析。
URL 参数（encodeURIComponent）：
- 确保通过 URL 传递的字符串不会因特殊字符而导致问题。
- 示例：
  - 前端通过 encodeURIComponent 对字符串进行编码。
  - 后端使用对应的解码工具（如 decodeURIComponent）还原数据。
二者结合：
- 对需要通过 URL 传递的 Base64 字符串，先用 btoa 编码，再用 encodeURIComponent 进一步转义。
- 示例：
```
const data = btoa('Sensitive data!');
const safeData = encodeURIComponent(data); // 用于安全的 URL 传递
```

注意的编码问题

如果需要处理 Unicode 数据（如中文）：

在 Base64 编码时，需先将其转换为 UTF-8 字符串。

使用 TextEncoder 和 TextDecoder 辅助：

const utf8ToBase64 = (str) =>
  btoa(String.fromCharCode(...new TextEncoder().encode(str)));
const base64ToUtf8 = (base64) =>
  new TextDecoder().decode(Uint8Array.from(atob(base64), (c) => c.charCodeAt(0)));

const data = '你好，世界';
const base64 = utf8ToBase64(data);
console.log(base64); // Base64 编码后的字符串

const original = base64ToUtf8(base64);
console.log(original); // 解码后的原始字符串

为什么不直接使用 `encodeURIComponent` 处理中文到 Base64？

总结：

使用 btoa 和 atob 处理ASCII数据的文本传输。
使用 encodeURIComponent 处理 URL 参数传递。
根据具体场景选择合适的工具，确保数据在前后端传输中的完整性与安全性。

`下面是由于未编码传输 URL 可能被破坏的情况:`

URL 可能被破坏的情况是由于未对特殊字符（如 &, ?, = 等）进行正确的转义或编码，导致 URL 被错误解析，进而导致参数丢失或数据不正确。

URL 被破坏的原因

特殊字符冲突：URL 的参数通常通过 & 分隔，值由 = 分配。如果参数值中包含这些符号而未编码，浏览器或服务器会将其误解为新的参数。
未编码的非 ASCII 字符：如果 URL 中包含中文或其他非 ASCII 字符，未正确编码时可能导致无法正确解析。

示例 1：未转义特殊字符导致解析错误

假设我们需要通过 URL 传递以下数据：

{
  "user": "张三",
  "message": "Hello & welcome!"
}

错误实现

const user = "张三";
const message = "Hello & welcome!";
const url = `https://example.com?user=${user}&message=${message}`;
console.log(url);

生成的 URL：

https://example.com?user=张三&message=Hello & welcome!

问题

& 被误解为新参数分隔符，welcome! 被丢失。
中文 张三 未编码，某些浏览器或服务器可能无法正确解析。

正确实现

使用 encodeURIComponent 对参数进行编码：

const user = encodeURIComponent("张三");
const message = encodeURIComponent("Hello & welcome!");
const url = `https://example.com?user=${user}&message=${message}`;
console.log(url);

生成的 URL：

https://example.com?user=%E5%BC%A0%E4%B8%89&message=Hello%20%26%20welcome%21

效果

& 被编码为 %26，不会被解析为分隔符。
中文 张三 被编码为 %E5%BC%A0%E4%B8%89，确保兼容性。

示例 2：Base64 数据未编码导致解析错误

假设我们传递 Base64 编码的文件内容：

const fileContent = btoa("Hello, World!");
const url = `https://example.com?file=${fileContent}`;
console.log(url);

生成的 URL：

https://example.com?file=SGVsbG8sIFdvcmxkIQ==

问题

Base64 中的 = 是 URL 中的保留字符，可能导致解析错误或数据丢失。
若 Base64 数据中包含 / 或 +，也可能干扰路径解析或被替换。

正确实现

使用 encodeURIComponent 对 Base64 数据进行编码：

const fileContent = encodeURIComponent(btoa("Hello, World!"));
const url = `https://example.com?file=${fileContent}`;
console.log(url);

生成的 URL：

https://example.com?file=SGVsbG8sIFdvcmxkIQ%3D%3D

效果

= 被编码为 %3D，避免误解为参数分隔符。
保证 Base64 数据在 URL 中传输的完整性。

示例 3：JSON 数据未编码导致解析错误

假设需要通过 URL 传递 JSON 数据：

{
  "name": "张三",
  "message": "Hello, 世界!",
  "emoji": "😊"
}

错误实现

const json = JSON.stringify({ name: "张三", message: "Hello, 世界!", emoji: "😊" });
const url = `https://example.com?data=${json}`;
console.log(url);

生成的 URL：

https://example.com?data={"name":"张三","message":"Hello, 世界!","emoji":"😊"}

问题

{ 和 } 未编码，可能被误解为路径或格式错误。
中文 张三 和表情符号 😊 未编码，某些环境下可能解析失败。

正确实现

使用 btoa 和 encodeURIComponent 组合：

const json = JSON.stringify({ name: "张三", message: "Hello, 世界!", emoji: "😊" });
const encodedData = encodeURIComponent(btoa(unescape(encodeURIComponent(json))));
const url = `https://example.com?data=${encodedData}`;
console.log(url);

生成的 URL：

https://example.com?data=eyJuYW1lIjoiJUU1JUJCJUEzJUU0JUJEJUEwIiwibWVzc2FnZSI6IkhlbGxvLCAlRTQlQjglQjAlRTUlQkMlODAhIiwiZW1vamkiOiLwn5iKIn0%3D

效果

所有特殊字符被安全编码。
JSON 数据可以无损传输。

总结

使用 btoa 和 encodeURIComponent 可以避免以下 URL 被破坏的常见问题：

特殊字符干扰：如 &, =, ? 等未正确编码会导致解析错误。
非 ASCII 字符：中文、表情符号等未编码可能导致丢失或乱码。
数据完整性：Base64 中的 =, /, + 等字符会干扰 URL 解析，需额外处理。

通过结合 btoa 和 encodeURIComponent，可以确保数据在 URL 中传输时的完整性和安全性，避免被错误解析或丢失。

atob、btoa 和 encodeURIComponent

1. atob 和 btoa

2. encodeURIComponent

前后端传输过程中的配合

注意的编码问题

为什么不直接使用 encodeURIComponent 处理中文到 Base64？

下面是由于未编码传输 URL 可能被破坏的情况:

URL 被破坏的原因

示例 1：未转义特殊字符导致解析错误

错误实现

问题

正确实现

效果

示例 2：Base64 数据未编码导致解析错误

问题

正确实现

效果

示例 3：JSON 数据未编码导致解析错误

错误实现

问题

正确实现

效果

总结

1. `atob` 和 `btoa`

2. `encodeURIComponent`

为什么不直接使用 `encodeURIComponent` 处理中文到 Base64？

`下面是由于未编码传输 URL 可能被破坏的情况:`