1、Base64的由来
目前Base64已经成为网络上常见的传输8bit字节流的编码方式之一。在做支付系统时,系统间的报文交互都需要使用Base64对明文进行转码,签名或加密,再进行传输。在嵌入式中二进制流用Base64转码后,进行传输。Base64转码原理,做了什么?
在报文输出过程中遇到:传输的字符并不全是可打印的字符,比如二进制文件、图片等,这时候Base64的出现就是为了解决此类问题你。它是基于64个可打印的字符来表示二进制数据的一种方法。
1.0 参考文档
https://blog.csdn.net/wo541075754/article/details/81734770
2、Base64的编码原理
Base64即定义了64个可见字符,包括26大写字母、26个小写字母、10个数字(0~9)、'+'和‘/’,并由之组成一个数组,这就是Base64的索引表。在日常使用中我们用'='作为填充字符。2^6 = 64,因此6个bit即可表示这64个字符。
具体转换步骤:
第一步:将待转换的二进制字节流每三个字节为一组,每个字节占8bit,那么共有24个bit。
第二步:将上面的24bit的二进制每6个一组,分为4组;
第三步:在每组前面添加两个0,这样就变成4个字节;
第四步:根据Base64编码对照表,按序号获取对应的值。
Base64用6个bit表示一个数,实际上一个字节8个bit,6和8的最小公倍数是24,因此3个字节为一组。由此可知经过Base64转码后,比原文大三分之一。
2.2最后字节不够情况
三个字节一组,当字节数不够时,该如何处理?两种情况:剩下两个字节、剩下一个字节
剩下两个字节:两个字节共16个bit,16-6*2 = 4bit,因此第三组缺2个bit,用0补齐,得到三个Base64编码,第四组完全没有数据就用'='补上;
剩下一个字节:一个字节共有8个bit,8-6*1 = 2bit,因此第二组缺4个bit,用0补齐,得到两个Base64编码,第三和第四组完全没有数据就用"=="补上。
2.3 扩展
Base32 就是用5个bit表示32个可见字符,5个字节为一组,按5bit拆分,分出8个字节来。
Base16就是用4个bit表示16个可见字符,1个字节为一组,按4bit才分,分出2个字节来。