Base64 编码的原理与应用

title

原文地址(同本人):
『Base64 编码的原理与应用』
链接: https://blog.rising-galaxy.top/archives/base64-bian-ma-de-yuan-li-yu-ying-yong
本文使用《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》协议授权,转载请附上原文出处链接和本声明。

Base64

Base64​ 一词出自一种特定的 MINE 内容传输编码

它是什么?

Wiki 上的一句话解释得很恰当:

Base64 是一种基于 64 个可打印字符来表示二进制数据的表示方法

这 64 个可打印字符中包括了字母 A-Z​、a-z​、数字 0-9​,这里就有 62 个字符了,还剩下两个可打印字符在不同的版本中有不同的变化。

一般我们单独提到术语 Base64​ 指代特定算法时,通常指的是 RFC 4648 第 4 节中概述的 Base64​ 版本。

也就是下表这些字符:

​​RFC 4648 标准的 Base64 索引表

编码方式

由于 log_264 = 6,所以每 6 个 bit​ 为一组,对应上表中的某一个可打印字符。我们知道 1 个字节有 8 位,即 1 byte = 8 bit​。因此我们可以找到 6 和 8 的最小公倍数 24,即每 3 个字节相当于 4 组 Base64​ 字符。

示例:

刚好三个字节的转换示例

可以看到 Man​ 转成 Base64​ 编码就成了 TWFu

上面这个是刚好 3 个字节能够对应转换的,那么问题来了,如果我没有刚好 3 个字节呢,也就是说我给的输入没有 24 或其倍数的位数该怎么处理?

在上面的 索引表 中可以看到除了那 64 个可打印字符外,还有一个填充字符 =​,它就是来解决这个问题的。

  1. 二进制位不足 6 个的情况在末尾补 0 至满足。
  2. 不足 4 组的,直接在结尾添填充符。

添加填充符的示例图

变种

base64 编码对应的 64 个可打印字符在一些特定的程序或协议中可能不适合使用,特别是字符表第 62 位 +​、63 位 /​ 和填充字符 =​,因此存在一些如下的变种:

Base64 编码变种图

Base64 优缺点

  • 优点

    1. 简化数据传输:通过将二进制数据转换为文本字符,Base64​ 编码使得数据在文本协议(如 HTTP、SMTP 等)中的传输更加安全和可靠。
    2. 兼容性好:编码后的数据可以在几乎所有文本处理系统中处理和存储,而不会出现乱码问题。
    3. 易于实现Base64​ 编码和解码算法简单,容易在各种编程语言中实现。
    4. 减少数据损坏:避免了在传输过程中由于字符编码问题导致的数据损坏。
  • 缺点

    1. 增加数据量:编码后的数据体积约为原始数据的 1.33 倍(即每 3 个字节的数据编码成 4 个字节的文本),这会增加传输和存储成本。
    2. 不适合大文件:由于编码后数据量的增加,不适合处理和传输非常大的文件。
    3. 无数据压缩Base64​ 编码不会对数据进行压缩,仅仅是转换,因此不会减少数据的实际存储空间。
    4. 安全性有限Base64​ 编码并不是加密方法,仅仅是编码方式,对敏感数据的保护作用有限,需要配合加密技术使用。

Base64 应用

  1. 数据传输:在 HTTP​ 协议中,表单数据通常以键值对的形式存在,这些数据在传输过程中可能会被截断或篡改。为了确保数据的完整性和安全性,可以使用 Base64​ 编码对表单数据进行编码后再传输。

  2. 邮件传输:SMTP​ 协议不支持直接传输二进制文件,因此需要将二进制文件(如附件)转换为 ASCII​ 格式。Base64​ 编码可以用于将二进制文件转换为适合在邮件中传输的格式。

  3. 数据加密:虽然 Base64​ 编码本身并不提供加密功能,但它可以与其他加密技术结合使用,如 AES​ 或 RSA​ 加密。首先对数据进行加密,然后使用 Base64​ 编码将加密后的数据进行编码,以便在不支持二进制数据的协议中传输。

  4. 数据存储:在某些数据库或文件系统中,可能需要将二进制数据存储为文本格式。使用 Base64​ 编码可以将二进制数据转换为文本字符串,以便在数据库或文件系统中存储。

  5. URL​ 编码:URL​ 中的参数通常需要进行编码,以避免特殊字符(如空格、&​ 等)导致的问题。虽然 URL​ 编码和 Base64​ 编码是不同的概念,但有时可以将 Base64​ 编码的数据作为 URL​ 参数的一部分进行传输。

  6. 证书和 API​ 密钥:在处理敏感信息(如 SSL​ 证书、API​ 密钥等)时,可以使用 Base64​ 编码对这些信息进行编码,以保护数据的隐私和安全。但请注意,Base64​ 编码并不能替代加密措施,它只是一种编码方式。

总之,Base64​ 编码在许多场景中都有应用,主要用于将二进制数据转换为适合在文本协议中传输的格式。然而,需要注意的是,Base64​ 编码并不能提供加密功能,因此在处理敏感数据时,还需要结合其他加密措施来确保数据的安全。

  • 16
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值