Base64从本质来说,其实并不是加密算法,只是一种编码方式而已,Base64的"加解密"也不叫加密解密,而是编码解码,但是现在一般都把它归为加密算法。
一、Base64简介
Base64编码将二进制数据编码为可现实的字母和数字,用于传送图形、声音和传真等非文本数据,常用于MIME电子邮件格式中。其使用含有65个字符和ASCLL字符集(第65个字符为"=",用于对字符串进行特殊处理),并用6个进制位标识一个可显示字符。
为什么会有Base64编码呢?
因为有些网络传送渠道并不支持所有的字节,例如传统的邮件只支持可见字符的传送,像ASCII码的控制字符就
不能通过邮件传送。这样用途就受到了很大的限制,比如图片二进制流的每个字节不可能全部是可见字符,所以就传送不了。最好的方法就是在不改变传统协议的情
况下,做一种扩展方案来支持二进制文件的传送。把不可打印的字符也能用可打印字符来表示,问题就解决了。Base64编码应运而生,Base64就是一种
基于64个可打印字符来表示二进制数据的表示方法。
二、Base64实现原理
它是用64个可打印字符表示二进制所有数据方法。由于2的6次方等于64,所以可以用每6个位元为一个单元,对应某个可打印字符。
我们知道三个字节有24个位元,就可以刚好对应于4个Base64单元,即3个字节需要用4个Base64的可打印字符来表示。在Base64中的可打印字符包括字母A-Z、a-z、数字0-9 ,这样共有62个字符,此外两个可打印符号在不同的系统中一般有所不同。但是,我们经常所说的Base64另外2个字符是:“+/”。这64个字符,所对应表如下。
转换的时候,将三个byte的数据,先后放入一个24bit的缓冲区中,先来的byte占高位。数据不足3byte的话,于缓冲区中剩下的bit用0补足。然后,每次取出6个bit,按照其值选择
ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/ 中的字符作为编码后的输出。不断进行,直到全部输入数据转换完成。
如果最后剩下两个输入数据,在编码结果后加1个“=”;如果最后剩下一个输入数据,编码结果后加2个“=”;如果没有剩下任何数据,就什么都不要加,这样才可以保证资料还原的正确性。
编码后的数据比原始数据略长,为原来的4/3。无论什么样的字符都会全部被编码。
举个例子:
比如说有一封邮件,我们想要对其使用Base64进行编码。怎么办呢?基本步骤如下:
(1)对邮件的数据进行切分,每三个字节一组,一共24个bit。
(2)对切分后的数据重组,24个bit重组为4组,每组6个bit。
(3)对重组后的数据处理,每组最前面添加两个“0”,构成每组8个bit。此时一共32个bit。
(4)根据Base64编码表,获取相应的编码值。
此时一封完整的邮件,被切分重组处理之后就变成了Base64编码了。基本原理其实很简单。不过你不理解也没关系,我们直接上个实例来解释一下。
三、Base64的安全性
因为他都不是一种加密算法,编码解码的方法,完全公开,所以安全性上比较差,但是人家主要也不是专门干这个的。
写在最后:
这篇文章写的不错:https://baijiahao.baidu.com/s?id=1644892102150918183&wfr=spider&for=pc