BASE64Decoder

最新推荐文章于 2022-07-20 09:30:06 发布

Felix.Ma

最新推荐文章于 2022-07-20 09:30:06 发布

阅读量3.3k

点赞数 3

分类专栏： Fbreader&移动DM

本文链接：https://blog.csdn.net/mafei852213034/article/details/53331233

版权

Fbreader&移动DM 专栏收录该内容

22 篇文章 2 订阅

订阅专栏

Base64 是网络上最常见的用于传输8Bit 字节代码的编码方式之一，大家可以查看RFC2045 ～RFC2049，上面有MIME 的详细规范。

Base64编码说明
　　Base64编码要求把3个8位字节（3*8=24）转化为4个6位的字节（4*6=24），之后在6位的前面补两个0，形成8位一个字节的形式。如果剩下的字符不足3个字节，则用0填充，输出字符使用'='，因此编码后输出的文本末尾可能会出现1或2个'='。

　　为了保证所输出的编码位可读字符，Base64制定了一个编码表，以便进行统一转换。编码表的大小为2^6=64，这也是Base64名称的由来。

Base64 要求把每三个8Bit 的字节转换为四个6Bit 的字节（3*8 = 4*6 = 24 ），然后把6Bit 再添两位高位0 ，组成四个8Bit 的字节，也就是说，转换后的字符串理论上将要比原来的长1/3 。

这样说会不会太抽象了？不怕，我们来看一个例子：

转换前 aaaaaabb ccccdddd eeffffff
转换后 00aaaaaa 00bbcccc 00ddddee 00ffffff

应该很清楚了吧？上面的三个字节是原文，下面的四个字节是转换后的Base64 编码，其前两位均为0。

Table 1: The Base64 Alphabet

索引	对应字符	索引	对应字符	索引	对应字符	索引	对应字符
0	A	17	R	34	i	51	z
1	B	18	S	35	j	52	0
2	C	19	T	36	k	53	1
3	D	20	U	37	l	54	2
4	E	21	V	38	m	55	3
5	F	22	W	39	n	56	4
6	G	23	X	40	o	57	5
7	H	24	Y	41	p	58	6
8	I	25	Z	42	q	59	7
9	J	26	a	43	r	60	8
10	K	27	b	44	s	61	9
11	L	28	c	45	t	62	+
12	M	29	d	46	u	63	/
13	N	30	e	47	v
14	O	31	f	48	w
15	P	32	g	49	x
16	Q	33	h	50	y

转码过程例子：

3*8=4*6

内存1个字符占8位

转前： s 1 3

先转成ascii：对应 115 49 51

2进制： 01110011 00110001 00110011

6个一组（4组） 011100110011 000100110011

然后才有后面的 011100 110011 000100 110011

然后计算机是8位8位的存数 6不够，自动就补两个高位0了

所有有了高位补0

科学计算器输入 00011100 00110011 00000100 00110011

得到 28 51 4 51

查对下照表 c z E z

BASE64是一种编码方式，通常用于把二进制数据编码为可写的字符形式的数据。

这是一种可逆的编码方式。

编码后的数据是一个字符串，其中包含的字符为：A-Z、a-z、0-9、+、/

共64个字符：26 + 26 + 10 + 1 + 1 = 64。

【注：其实是65个字符，“=”是填充字符】。

64个字符需要6位来表示，表示成数值为0~63。

这样，长度为3个字节的数据经过Base64编码后就变为4个字节。

例：

字符串“Xue”经过Base64编码后变为“WHVl”。

长度为3个字节的数据位数是8*3=24，可以精确地分成6*4。

如果数据的字节数不是3的倍数，则其位数就不是6的倍数，那么需要就不能精确地划分成6位的块。，

此时，需在原数据后面添加1个或2个零值字节，使其字节数是3的倍数。

然后，在编码后的字符串后面添加1个或2个等号“=”，表示所添加的零值字节数。

例：

字符串“Xu”经过Base64编码后变为“WHU=”。

字符串“X”经过Base64编码后变为“WA==”。

让我们再来看一个实际的例子，加深印象！

转换前 101011 01 1011 1010 01 110110
转换后 00101011 00011011 00101001 00110110
十进制 43 27 41 54
对应码表中的值 r b p 2

所以上面的24 位编码，编码后的Base64 值为 rbp2
解码同理，把 rbq2 的二进制位连接上再重组得到三个8 位值，得出原码。
（解码只是编码的逆过程，在此我就不多说了，另外有关MIME 的RFC 还是有很多的，如果需要详细情况请自行查找。）

用更接近于编程的思维来说，编码的过程是这样的：

第一个字符通过右移2 位获得第一个目标字符的Base64 表位置，根据这个数值取到表上相应的字符，就是第一个目标字符。
然后将第一个字符左移4 位加上第二个字符右移4 位，即获得第二个目标字符。
再将第二个字符左移2 位加上第三个字符右移6 位，获得第三个目标字符。
最后取第三个字符的右6 位即获得第四个目标字符。

在以上的每一个步骤之后，再把结果与 0x3F 进行 AND 位操作，就可以得到编码后的字符了。

可是等等…… 聪明的你可能会问到，原文的字节数量应该是3 的倍数啊，如果这个条件不能满足的话，那该怎么办呢？

我们的解决办法是这样的：原文的字节不够的地方可以用全0 来补足，转换时Base64 编码用= 号来代替。这就是为什么有些Base64 编码会以一个或两个等号结束的原因，但等号最多只有两个。因为：

余数 = 原文字节数 MOD 3

所以余数任何情况下都只可能是0 ，1 ，2 这三个数中的一个。如果余数是0 的话，就表示原文字节数正好是3 的倍数（最理想的情况啦）。如果是1 的话，为了让Base64 编码是4 的倍数，就要补2 个等号；同理，如果是2 的话，就要补1 个等号。
在线转换:http://md5.mmkey.com/base64/

例子一：

Java code

import sun.misc.BASE64Decoder;

import sun.misc.BASE64Encoder;

public class Test {

public static void main(String args[]) throws IOException {

BASE64Encoder encode = new BASE64Encoder();

String base64 = encode.encode(" 五笔字型电子计算机".getBytes());

System.out.println(base64);

BASE64Decoder decode = new BASE64Decoder();

byte [] b = decode.decodeBuffer(base64);

System.out.println( new String(b));

}

输出：

zuWxytfW0M2159fTvMbL47v6
五笔字型电子计算机

JRE 中 sun 和 com.sun 开头包的类都是未被文档化的，他们属于 java, javax
类库的基础，其中的实现大多数与底层平台有关，一般来说是不推荐使用的。

Base64 主要不是加密，它主要的用途是把一些二进制数转成普通字符用于网络传输。
由于一些二进制字符在传输协议中属于控制字符，不能直接传送需要转换一下就可以了。

例子二：

try {
    byte[] KEY_DATA = {1,8,-49,-31,77,90,10,121,-14,109,107,38,29,68,59,5,82,49,31,42,-25,67,96,15};
    Cipher cipher = Cipher.getInstance(" DESede/ECB/PKCS5Padding ");
    SecretKeySpec key = new SecretKeySpec(KEY_DATA, "DESede");// 生成加密解密需要的 Key
    cipher.init(Cipher.ENCRYPT_MODE, key);
    byte[] res = cipher.doFinal(data.getBytes());
} catch (Exception e) {
    e.printStackTrace();
}

Felix.Ma

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
BASE64Decoder

Base64 是网络上最常见的用于传输8Bit 字节代码的编码方式之一，大家可以查看RFC2045 ～RFC2049，上面有MIME 的详细规范。Base64 要求把每三个8Bit 的字节转换为四个6Bit 的字节（3*8 = 4*6 = 24 ），然后把6Bit 再添两位高位0 ，组成四个8Bit 的字节，也就是说，转换后的字符串理论上将要比原来的长1/3 。这样说会不会太抽象了
复制链接

扫一扫

专栏目录