1、原理
简单来将,Base64就是一种用64个Ascii字符来表示任意二进制数据的方法。主要用于将不可打印的字符转换成可打印字符,或者简单的说将二进制数据编码成Ascii字符。Base64是网络上最常用的传输8bit字节数据的编码方式之一。Base64的原理比较简单,每当我们使用Base64时都会先定义一个类似这样的数组:
['A', 'B', 'C', ... 'a', 'b', 'c', ... '0', '1', ... '+', '/']
上面就是Base64的索引表,字符选用了”A-Z、a-z、0-9、+、/” 64个可打印字符,这是标准的Base64协议规定。在使用中我们还会看到“=”或“==”号出现在Base64的编码结果中,“=”在此是作为填充字符出现,后面会讲到。
具体转换步骤如下:
- 将待转换的字符串每三个字节分为一组,每个字节占8bit,那么共有24个二进制位。
- 将上面的24个二进制位每6个一组,共分为4组。
- 在每组前面添加两个0,每组由6个变为8个二进制位,总共32个二进制位,即四个字节。
- 根据Base64编码对照表(见下图)获得对应的值。
- 在编码后的字符串后面添加1个或2个等号“=”,表示所添加的零值字节数。解码的时候,会自动去掉。
2、例子
转换前 11111111, 11111111, 11111111 (二进制)。
转换后 00111111, 00111111, 00111111, 00111111 (二进制)。
上面的三个字节是原文,下面的四个字节是转换后的Base64编码,其前两位均为0。
转换后,我们用一个码表来得到我们想要的字符串(也就是最终的Base64编码),这个表是这样的:
从这个表中,获得和上面转换后的新字符。可见,编码后变长了。
3、java例子
public class Base64Test {
public static void main(String[] args) {
String base64encodedString = null;
try {
base64encodedString = Base64.getEncoder()
.encodeToString("Base64 Encoding Base64 Encoding Base64 Encoding".getBytes("utf-8"));
System.out.println("Base64 编码字符串 (基本) :" + base64encodedString);
byte[] base64decodedBytes = Base64.getDecoder().decode(base64encodedString);
System.out.println("原始字符串: " + new String(base64decodedBytes, "utf-8"));
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
}
}
输出如下:
Base64 编码字符串 (基本) :QmFzZTY0IEVuY29kaW5nIEJhc2U2NCBFbmNvZGluZyBCYXNlNjQgRW5jb2Rpbmc=
原始字符串: Base64 Encoding Base64 Encoding Base64 Encoding
4、应用
base64其实不是安全领域下的加密解密算法。虽然有时候经常看到所谓的base64加密解密。其实base64只能算是一个编码算法,对数据内容进行编码来适合传输。虽然base64编码过后原文也变成不能看到的字符格式,但是这种方式很初级,很简单。