Base64编码介绍及基于Java语言实现
Base64编码被设计用来表示任意顺序的八位一个字节单元,允许使用大写和小写字符而不要求内容可读。65个US-ASCII子集被用来表示Base64编码,所以每六位表示一个可以打印的Base64的字符,第65字符’=’被用来表示特殊处理的功能字符,后面会详细说明。
预编码处理一次输入24位(三个字符)作为一组,输出的是四个Base64的编码字符24位(每个字符六位)。编码处理遵循从左到右的顺序,一个24位的输入可以看作是三个八位的字符组,
编码以后,24位的字符则被转换为四个6位的字符组,每个字符被翻译成Base64字符表中的匹配的一个字符。
每六位都被转换成为一个index数值去匹配Base64编码表中的一个字符输出,Base64的字符表如下:
Value Encoding Value Encoding Value Encoding Value Encoding
0 A 17 R 34 i 51 z
1 B 18 S 35 j 52 0
2 C 19 T 36 k 53 1
3 D 20 U 37 l 54 2
4 E 21 V 38 m 55 3
5 F 22 W 39 n 56 4
6 G 23 X 40 o 57 5
7 H 24 Y 41 p 58 6
8 I 25 Z 42 q 59 7
9 J 26 a 43 r 60 8
10 K 27 b 44 s 61 9
11 L 28 c 45 t 62 +
12 M 29 d 46 u 63 /
13 N 30 e 47 v
14 O 31 f 48 w (pad) =
15 P 32 g 49 x
16 Q 33 h 50 y
字符’=’作为填充字符,对于任何不满足24为输入的编码字符,以零做作为填充成为24位(三字节)输入,对于任何输出的编码字符小于24位的都应当以’=’字符填充。对于以下情形:
Ø 最后输入正好是24位的编码字符,则不需要’=’字符填充,输出即为四个Base64字符编码.
Ø 最后输入只有八位的编码字符,则需要填充两个特殊字符’=’,输出即为两个Base64字符编码加上两个’=’.
Ø 最后输入只有十六位的编码字符,则需要填充一个特殊字符’=’,输出即为三个Base64字符加上一个’=’.
把一个二进制的数据转换为Base64的编码,下面的例子就说明Base64怎么编码三个字节的二进制数据的。
+--first octet--+-second octet--+--third octet--+
|7 6 5 4 3 2 1 0|7 6 5 4 3 2 1 0|7 6 5 4 3 2 1 0|
+-----------+---+-------+-------+---+-----------+
|5 4 3 2 1 0|5 4 3 2 1 0|5 4 3 2 1 0|5 4 3 2 1 0|
+--1.index--+--2.index--+--3.index--+--4.index--+
许多网络程序中用来传输二进制文件也经常采用Base64的编码算法,一个最典型的例子就是Email的应用协议SMPT发送MIME数据的时候就常采用Base64来发送,而且已经被写入标准的RFC中,在Java语言中,JDK已经提供了Base64的API。
下面基于Java实现的Base64的编码和解码程序,相比于JDK6中把Base64编码和解码分在两个不同的API Class中,因此还把许多人搞得很晕来说,也许本人的实现会略微方便点。
package com.gloomyfish.smtp.util;
public class Base64Coder {
public final static char[] base64_alphabet = new char[]{
'A','B','C','D','E','F','G','H','I','J','K','L','M','N','O','P','Q','R','S'
,'T','U','V','W','X','Y','Z','a','b','c','d','e','f','g','h','i','j','k','l'
,'m','n','o','p','q','r','s','t','u','v','w','x','y','z','0','1','2','3','4'
,'5','6','7','8','9','+','/','='
};
public static String encode(String content) {
byte[] data = content.getBytes();
int length = data.length;
byte[] char_array_3 = new byte[]{0, 0, 0};
byte[] char_array_4 = new byte[]{'=','=','=','='};
String retContent = "";
int i = 0;
int j = 0;
int reversePos = 0;
while(length > 0) {
length--;
char_array_3[i++] = data[reversePos++];
if(i==3) {
char_array_4[0] = (byte)((char_array_3[0] & 0xfc) >> 2); // convert the char
char_array_4[1] = (byte)(((char_array_3[0] & 0x03) << 4) + ((char_array_3[1] & 0xf0) >> 4));
char_array_4[2] = (byte)(((char_array_3[1] & 0x0f) << 2) + ((char_array_3[2] & 0xc0) >> 6));
char_array_4[3] = (byte)(char_array_3[2] & 0x3f);
for(i = 0; (i <4) ; i++)
retContent += base64_alphabet[char_array_4[i]];
i = 0;
}
}
// handling the last input content
if (i > 0 )
{
for(j = i; j < 3; j++)
char_array_3[j] = 0; // padding of zero
char_array_4[0] = (byte)((char_array_3[0] & 0xfc) >> 2); // right shift
char_array_4[1] = (byte)(((char_array_3[0] & 0x03) << 4) + ((char_array_3[1] & 0xf0) >> 4));
char_array_4[2] = (byte)(((char_array_3[1] & 0x0f) << 2) + ((char_array_3[2] & 0xc0) >> 6));
char_array_4[3] = (byte)(char_array_3[2] & 0x3f);
for (j = 0; (j < i + 1); j++)
retContent += base64_alphabet[char_array_4[j]];
while((i++ < 3)) // padding of '=' of output string
retContent += '=';
}
return retContent;
}
public static String decode(String enContent) {
byte[] data = enContent.getBytes();
int i = 0, j = 0, enCode = 0;
int mLength = data.length;
byte[] char_array_4 = new byte[4];
byte[] char_array_3 = new byte[3];
String retContent = "";
// filter out the padding '=' chars
while (mLength > 0 && (((char)data[enCode]) != '=') && isBase64((char)data[enCode]))
{
mLength--;
char_array_4[i++] = data[enCode++];
if (i ==4) {
for (i = 0; i <4; i++)
char_array_4[i] = findChar((char)char_array_4[i]);
char_array_3[0] = (byte)((char_array_4[0] << 2) + ((char_array_4[1] & 0x30) >> 4));
char_array_3[1] = (byte)(((char_array_4[1] & 0xf) << 4) + ((char_array_4[2] & 0x3c) >> 2));
char_array_3[2] = (byte)(((char_array_4[2] & 0x3) << 6) + char_array_4[3]);
for (i = 0; (i < 3); i++)
retContent += (char)char_array_3[i];
i = 0;
}
}
// last content handling
if (i > 0)
{
for (j = i; j <4; j++)
char_array_4[j] = 0;
for (j = 0; j <4; j++)
char_array_4[j] = findChar((char)char_array_4[j]);
char_array_3[0] = (byte)((char_array_4[0] << 2) + ((char_array_4[1] & 0x30) >> 4));
char_array_3[1] = (byte)(((char_array_4[1] & 0xf) << 4) + ((char_array_4[2] & 0x3c) >> 2));
char_array_3[2] = (byte)(((char_array_4[2] & 0x3) << 6) + char_array_4[3]);
for (j = 0; (j < i - 1); j++)
retContent += (char)char_array_3[j];
}
return retContent;
}
public static boolean isBase64(char c)
{
boolean base64 = false;
for(int i=0; i<64; i++) {
if( c == base64_alphabet[i]) {
base64 = true;
break;
}
}
return base64;
}
public static byte findChar(char x) {
byte index = 64; // 65th char '='
for(int i=0; i<64; i++) {
if( x == base64_alphabet[i]) {
index = (byte)i;
break;
}
}
return index;
}
/**
* <p> test data and result should like below output , RFC4648 Sample </p>
* BASE64("") = ""
* BASE64("f") = "Zg=="
* BASE64("fo") = "Zm8="
* BASE64("foo") = "Zm9v"
* BASE64("foob") = "Zm9vYg=="
* BASE64("fooba") = "Zm9vYmE="
* BASE64("foobar") = "Zm9vYmFy"
*
*
* @param args
*/
public static void main(String[] args) {
// BASE64Encoder coder = new BASE64Encoder();
// System.out.println(coder.encode("foobar".getBytes()));
System.out.println("#--------------encode---------------#");
System.out.println(encode(""));
System.out.println(encode("f"));
System.out.println(encode("fo"));
System.out.println(encode("foo"));
System.out.println(encode("foob"));
System.out.println(encode("fooba"));
System.out.println(encode("foobar"));
System.out.println(encode("123456789sS{1}quot;));
System.out.println("#--------------decode---------------#");
System.out.println(decode(""));
System.out.println(decode("Zg=="));
System.out.println(decode("Zm8="));
System.out.println(decode("Zm9v"));
System.out.println(decode("Zm9vYg=="));
System.out.println(decode("Zm9vYmE="));
System.out.println(decode("Zm9vYmFy"));
System.out.println(decode("MTIzNDU2Nzg5c1Mk"));
}
}