终于弄懂base64编码了,原来别人学的跟我学的不一样

hello啊,我是冷凌爱,我又来发笔记了,嘿嘿,
我视频做不出来,笔记还写不出来吗

上一篇:快速了解摩斯密码并实现音频转换

一、base16

Base16,也被称为十六进制编码。是最早的Base编码形式,它使用16个ASCII可打印字符(数字0-9和字母A-F)对任意字节数据进行编码。

十六进制是一种基数为16的数制,使用16个符号来表示值。最常用的符号集是0-9来表示值0到9,以及A-F(或小写的a-f)来表示值10到15。由于计算机使用二进制系统(基数2),而人类更习惯于十进制(基数10),十六进制提供了一种方便的方式来简化二进制数据的阅读和理解。每四个二进制位(bit)可以被转换为一个十六进制数字,这种转换使得数据更加紧凑和易于处理。

说白了,base16就是把二进制数据转换成16进制来表示。

二、base64

在早期,电子邮件只允许传输ASCII码字符。这意味着任何非ASCII字符,如中文、图片、视频等二进制文件,都无法直接通过电子邮件传输。Base64编码允许非ASCII码的二进制数据通过转换成64个可打印字符(A-Z、a-z、0-9、+、/)来传输,从而避免了在传输过程中被网关修改的问题。Base64编码最早出现在1982年的RFC 714中,后来在RFC 2045中被标准化。

2.1 规则原理

ps:我的大学老师教的

每6位bit作为一个base64单元,对应一个可打印字符。2的6次方等于64,从000000-111111,也就是十进制的0-63,按顺序依次表示
ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/

  1. (补位)将数据以每三个字节先后放入缓冲区,最后不足三个字节的,补0。
  2. (6位十进制表示)每次取6个bit,转换为对应的10进制(0~63)。
  3. (按规则编码)将每个十进制转换为base64对应的可打印字符,例如3代表D。
  4. (末尾处理)若原数据字节长度不是3的倍数,就需要进行特殊处理。若原数据分组处理到最后只剩一个字节,就将base64字符末尾的两个‘A’替换为两个==;
    若原数据分组处理到最后剩下两个字节就替换一个=;
    正好是3的倍数,就不替换。
    即应该替换(3-原数据字节长度%3)个“=”

我看到别的博文可能在补0的长度以及不足3个字节的处理上,并不是这样说的,而是补够一个base字符所需的0,再加上=

若最后还剩只有 1 个字节(8 位)的数据,先将其转换为 2 个 6 位的数据组(前面 6 位一组和后面 2 位补 4 个 0一组),这样最后一个字节编码成 2 个 Base64 字符。然后再末尾加上 2 个 “=” 来表示这是不完整的编码。
如果最后是 2 个字节(16 位)的数据,会转换为 3 个 6 位的数据组(第一个字节的前 6位一组;第一个字节的后2位和第二个字节的前 4 位一组;第二个字节的后 4 位再补上 2 个 0 一组);编码成 3 个 Base64 字符。然后末尾再加上1 个 “=”来表示这是不完整的编码。

其实这两种说法在结果都是一样,“=”的目的是在解码过程中,根据 “=” 的数量来判断原始数据的字节数。

2.2 =的作用

  • 如果编码字符串末尾没有 “=”,则表示原始数据的字节数是 3 的倍数。解码时,直接将 4 个 Base64 字符转换回 3 个字节的原始数据。
  • 如果编码字符串末尾有 1 个 “=”,则表示原始数据字节数是 3 的倍数余 2。在解码时,将最后3 个 Base64 字符对应的 18 位数据(每个 Base64 字符 6 位)中的,前 16 位转换为 2 个字节,丢弃最后 2 位(因为这是填充位)。
  • 如果编码字符串末尾有 2 个 “=”,则表示原始数据字节数是 3 的倍数余 1。在解码时,将最后 2 个 Base64 字符对应的 12 位数据,前 8 位转换为 1 个字节,丢弃最后 4 位(填充位)。

*被我越说越迷糊了吗?可能我有点唠叨了。没关系,我们举几个例子。 *

2.3 示例:单字节

h->base64->aA==

first:补够3个字节的0,最后替换末尾的两个‘A’为=

在这里插入图片描述
上面的是我大学老师教的,补够3个字节,最后替换‘A’

-----------------------------------------------------------------------分割线-----------------------------------------------------------------------------------------------------------------------

second:补够base64字符所需的0,最后加上=

在这里插入图片描述

2.4示例:两个字节

he->base64->

补够3个字节的0,替换最后一个‘A’为=
在这里插入图片描述

-----------------------------------------------------------------------------------分割线---------------------------------------------------------------------

补够base字符所需的0,最后加上一个=
在这里插入图片描述

有了这两个示例就应该很清楚了吧,在代码实现上,后一种说法肯定要更好一些,因为不用补那么多零,只需要计算原数据字节长度除以3的余数,余数是1就加两个=,余数是2就加一个=。

base64在转换中文时,会因为根据所使用的中文编码不同
“点赞”用gbk转换base64就是tePU3g==
“点赞”用utf-8转换base64就是54K56LWe

base64与图片

前面我们已经说过了,base64编码的目的就是为了让中文、图片、视频等信息可以用ASCII表示和传输。把图片的二进制数据按照 Base64 编码规则进行编码,就可以使得图片数据可以用可打印的 ASCII 字符来表示,方便在网络传输或者文本存储中使用。

可以使用在线网站或者小工具,例如ctool工具箱中的base64编码。
浏览器也支持直接解析
在代码中将base64解码成二进制数据,直接存为image图片。

base扩展

除此之外还有base32,base58等等,只是具体的编码规则不一样。
因为我是想说base64的,就不说别的了。

--------------------------------------------------分隔线------------------------------------------------------------

感觉写的还不是很清楚,文字表达的不是很简洁,多批评啦。

下一篇发什么呢?Brainfuck还是qrcode?我需要想一想
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

冷凌爱

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值