hello啊,我是冷凌爱,我又来发笔记了,嘿嘿,
我视频做不出来,笔记还写不出来吗
上一篇:快速了解摩斯密码并实现音频转换
一、base16
Base16,也被称为十六进制编码。是最早的Base编码形式,它使用16个ASCII可打印字符(数字0-9和字母A-F)对任意字节数据进行编码。
十六进制是一种基数为16的数制,使用16个符号来表示值。最常用的符号集是0-9来表示值0到9,以及A-F(或小写的a-f)来表示值10到15。由于计算机使用二进制系统(基数2),而人类更习惯于十进制(基数10),十六进制提供了一种方便的方式来简化二进制数据的阅读和理解。每四个二进制位(bit)可以被转换为一个十六进制数字,这种转换使得数据更加紧凑和易于处理。
说白了,base16就是把二进制数据转换成16进制来表示。
二、base64
在早期,电子邮件只允许传输ASCII码字符。这意味着任何非ASCII字符,如中文、图片、视频等二进制文件,都无法直接通过电子邮件传输。Base64编码允许非ASCII码的二进制数据通过转换成64个可打印字符(A-Z、a-z、0-9、+、/)来传输,从而避免了在传输过程中被网关修改的问题。Base64编码最早出现在1982年的RFC 714中,后来在RFC 2045中被标准化。
2.1 规则原理
ps:我的大学老师教的
每6位bit作为一个base64单元,对应一个可打印字符。2的6次方等于64,从000000-111111,也就是十进制的0-63,按顺序依次表示
ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/
- (补位)将数据以每三个字节先后放入缓冲区,最后不足三个字节的,补0。
- (6位十进制表示)每次取6个bit,转换为对应的10进制(0~63)。
- (按规则编码)将每个十进制转换为base64对应的可打印字符,例如3代表D。
- (末尾处理)若原数据字节长度不是3的倍数,就需要进行特殊处理。若原数据分组处理到最后只剩一个字节,就将base64字符末尾的两个‘A’替换为两个==;
若原数据分组处理到最后剩下两个字节就替换一个=;
正好是3的倍数,就不替换。
即应该替换(3-原数据字节长度%3)个“=”。
我看到别的博文可能在补0的长度以及不足3个字节的处理上,并不是这样说的,而是补够一个base字符所需的0,再加上=
若最后还剩只有 1 个字节(8 位)的数据,先将其转换为 2 个 6 位的数据组(前面 6 位一组和后面 2 位补 4 个 0一组),这样最后一个字节编码成 2 个 Base64 字符。然后再末尾加上 2 个 “=” 来表示这是不完整的编码。
如果最后是 2 个字节(16 位)的数据,会转换为 3 个 6 位的数据组(第一个字节的前 6位一组;第一个字节的后2位和第二个字节的前 4 位一组;第二个字节的后 4 位再补上 2 个 0 一组);编码成 3 个 Base64 字符。然后末尾再加上1 个 “=”来表示这是不完整的编码。
其实这两种说法在结果都是一样,“=”的目的是在解码过程中,根据 “=” 的数量来判断原始数据的字节数。
2.2 =的作用
- 如果编码字符串末尾没有 “=”,则表示原始数据的字节数是 3 的倍数。解码时,直接将 4 个 Base64 字符转换回 3 个字节的原始数据。
- 如果编码字符串末尾有 1 个 “=”,则表示原始数据字节数是 3 的倍数余 2。在解码时,将最后3 个 Base64 字符对应的 18 位数据(每个 Base64 字符 6 位)中的,前 16 位转换为 2 个字节,丢弃最后 2 位(因为这是填充位)。
- 如果编码字符串末尾有 2 个 “=”,则表示原始数据字节数是 3 的倍数余 1。在解码时,将最后 2 个 Base64 字符对应的 12 位数据,前 8 位转换为 1 个字节,丢弃最后 4 位(填充位)。
*被我越说越迷糊了吗?可能我有点唠叨了。没关系,我们举几个例子。 *
2.3 示例:单字节
h->base64->aA==
first:补够3个字节的0,最后替换末尾的两个‘A’为=
上面的是我大学老师教的,补够3个字节,最后替换‘A’
-----------------------------------------------------------------------分割线-----------------------------------------------------------------------------------------------------------------------
second:补够base64字符所需的0,最后加上=
2.4示例:两个字节
he->base64->
补够3个字节的0,替换最后一个‘A’为=
-----------------------------------------------------------------------------------分割线---------------------------------------------------------------------
补够base字符所需的0,最后加上一个=
有了这两个示例就应该很清楚了吧,在代码实现上,后一种说法肯定要更好一些,因为不用补那么多零,只需要计算原数据字节长度除以3的余数,余数是1就加两个=,余数是2就加一个=。
base64在转换中文时,会因为根据所使用的中文编码不同
“点赞”用gbk转换base64就是tePU3g==
“点赞”用utf-8转换base64就是54K56LWe
base64与图片
前面我们已经说过了,base64编码的目的就是为了让中文、图片、视频等信息可以用ASCII表示和传输。把图片的二进制数据按照 Base64 编码规则进行编码,就可以使得图片数据可以用可打印的 ASCII 字符来表示,方便在网络传输或者文本存储中使用。
可以使用在线网站或者小工具,例如ctool工具箱中的base64编码。
浏览器也支持直接解析
在代码中将base64解码成二进制数据,直接存为image图片。
base扩展
除此之外还有base32,base58等等,只是具体的编码规则不一样。
因为我是想说base64的,就不说别的了。
--------------------------------------------------分隔线------------------------------------------------------------
感觉写的还不是很清楚,文字表达的不是很简洁,多批评啦。
下一篇发什么呢?Brainfuck还是qrcode?我需要想一想