Base64被广泛用于xml类型的文档中,通过实现编码和译码,可以练习一下c++
首先,我们要知道什么是Base64编码。它是把二进制文件存储成为文本文件后的文件的编码,它是64位进制的编码,所以对于0至63的数字我们都需要一个字符来表示。Base64的字符集很简单,0-25 这26位是[A-Z] 26-51这26位是[a-z],52-61这十位是[0-9] 62位是+ 63位是/ 这里我们添加一个64号位=。 =号作用很大,一会再说。
Base64的编码过程是这样的,首先读取一个二进制文件,然后,把每三个byte取出来,对于这三个byte如何处理呢?3个byte即3*8=24 bit 我们把每6个bits拿出来,共4*6 = 24,所以有4个6位的二进制数,我们在这4个数的首位均补上两个0,这样可以得到4个byte,我们把文件的长度增加了三分之一左右,但是让所有的byte所表示的数字均不超过63,我们这时使用Base64的字符集把数字映射成字符,然后就成为了文本。如果它的字节数不是3的倍数呢,我们可以在它们占位的地方使用=
这里我们说编码过程是为了解码,如果解码做出来了其实编码很简单。
因为c++中cout很好用,所以用的是c++语言,但是里面除去cout部分都是使用c的库和函数,所以可以说这个是c/c++通用的。
我们要解码,首先,我们要把每4个字符拿出来,变成4个6bit的值。因为源文件为文本文件,目标文件是二进制文件,所以在读取的时候使用fgetc,写入时使用fwrite
const int map_length = 65;
struct bits {
unsigned a:6;
unsigned b:6;
unsigned c:6;
unsigned d:6;
};
const char map[map_length] = {
'A','B','C','D','E',
'F','G','H','I','J',
'K','L','M','N','O',
'P','Q','R','S','T',
'U','V','W','X','Y',
'Z','a','b','c','d',
'e','f','g','h','i',
'j','k','l','m','n',
'o','p','q','r','s',
't','u','v','w','x',
'y','z','0','1','2',
'3','4','5','6','7',
'8','9','+','/','=',
};
这个是映射表,以及存储4个6bit的数据结构。
int getIndex(char c){
for(int i=0; i<map_length; i++){
if(map[i] == c) {
return i;
}
}
cout << "invalid char!!" << endl;
exit(1);
}
通过字符查找索引数字。
int main()
{
cout << "Hello world!" << endl;
/* 下行代码结果为 1,所以char是1byte的
cout << sizeof(char) << endl;*/
FILE * file = 0, * wfile = 0;
/* 把从mht文件中找到的base64编码复制到一个文本文件中
* 是一个png文件,取名为a.png.base64,只读打开
* 再打开一个输出文件result.png 二进制写入方式
* i是在循环中计数用的
* block用来一次性表示3个byte块
* buf用来存储拿到的四个整数
* tmp是当前拿到的字符
*/
file = fopen("a.png.base64","r");
wfile = fopen("result.png", "wb");
int i=0;
bits block;
int buf[4];
char tmp;
if(file == 0 || wfile == 0) {
cout << "Error opening file!" << endl;
exit(1);
}
// 获取字符,输出到屏幕,忽略掉\n并写入文件中
// 这里要注意,实际中block内部存储的顺序:dcba
// 这里要倒置两次
while(!feof(file)) {
tmp = fgetc(file);
if(tmp != '\n') {
buf[i % 4] = getIndex(tmp);
i++;
if(i % 4 == 0) {
block.a = buf[3];
block.b = buf[2];
block.c = buf[1];
block.d = buf[0];
char *tmp;
char chs[3];
tmp = (char *)█
chs[0] = tmp[2];
chs[1] = tmp[1];
chs[2] = tmp[0];
fwrite(chs, 1, 3, wfile);
}
cout << tmp;
//fputc(tmp, wfile);
}
}
fclose(file);
fclose(wfile);
cout << endl;
//没什么作用,表示结束了,打印下好看
for(int i=0; i<65; i++) {
cout << "=";
}
return 0;
}
有一点不足,文件最后会出现一次invalid char,可能是文件结束符eof吧,没管它,因为在那之前已经写入文件了。