C/C++ Base64解码器

    Base64被广泛用于xml类型的文档中,通过实现编码和译码,可以练习一下c++

    首先,我们要知道什么是Base64编码。它是把二进制文件存储成为文本文件后的文件的编码,它是64位进制的编码,所以对于0至63的数字我们都需要一个字符来表示。Base64的字符集很简单,0-25 这26位是[A-Z] 26-51这26位是[a-z],52-61这十位是[0-9] 62位是+ 63位是/ 这里我们添加一个64号位=。 =号作用很大,一会再说。

    Base64的编码过程是这样的,首先读取一个二进制文件,然后,把每三个byte取出来,对于这三个byte如何处理呢?3个byte即3*8=24 bit 我们把每6个bits拿出来,共4*6 = 24,所以有4个6位的二进制数,我们在这4个数的首位均补上两个0,这样可以得到4个byte,我们把文件的长度增加了三分之一左右,但是让所有的byte所表示的数字均不超过63,我们这时使用Base64的字符集把数字映射成字符,然后就成为了文本。如果它的字节数不是3的倍数呢,我们可以在它们占位的地方使用=

    这里我们说编码过程是为了解码,如果解码做出来了其实编码很简单。

    因为c++中cout很好用,所以用的是c++语言,但是里面除去cout部分都是使用c的库和函数,所以可以说这个是c/c++通用的。

    我们要解码,首先,我们要把每4个字符拿出来,变成4个6bit的值。因为源文件为文本文件,目标文件是二进制文件,所以在读取的时候使用fgetc,写入时使用fwrite

    

const int map_length = 65;

struct bits {
    unsigned a:6;
    unsigned b:6;
    unsigned c:6;
    unsigned d:6;
};

const char map[map_length] = {
    'A','B','C','D','E',
    'F','G','H','I','J',
    'K','L','M','N','O',
    'P','Q','R','S','T',
    'U','V','W','X','Y',
    'Z','a','b','c','d',
    'e','f','g','h','i',
    'j','k','l','m','n',
    'o','p','q','r','s',
    't','u','v','w','x',
    'y','z','0','1','2',
    '3','4','5','6','7',
    '8','9','+','/','=',
};

 这个是映射表,以及存储4个6bit的数据结构。

int getIndex(char c){
    for(int i=0; i<map_length; i++){
        if(map[i] == c) {
            return i;
        }
    }
    cout << "invalid char!!" << endl;
    exit(1);
}

通过字符查找索引数字。

 

int main()
{
    cout << "Hello world!" << endl;
/*  下行代码结果为 1,所以char是1byte的
    cout << sizeof(char) << endl;*/

    FILE * file = 0, * wfile = 0;
    /* 把从mht文件中找到的base64编码复制到一个文本文件中
     * 是一个png文件,取名为a.png.base64,只读打开
     * 再打开一个输出文件result.png 二进制写入方式
     * i是在循环中计数用的
     * block用来一次性表示3个byte块
     * buf用来存储拿到的四个整数
     * tmp是当前拿到的字符
     */
    file = fopen("a.png.base64","r");
    wfile = fopen("result.png", "wb");
    int i=0;
    bits block;
    int buf[4];
    char tmp;

    if(file == 0 || wfile == 0) {
        cout << "Error opening file!" << endl;
        exit(1);
    }


    // 获取字符,输出到屏幕,忽略掉\n并写入文件中
    
    // 这里要注意,实际中block内部存储的顺序:dcba
    // 这里要倒置两次
    while(!feof(file)) {
        tmp = fgetc(file);
        if(tmp != '\n') {
            buf[i % 4] = getIndex(tmp);
            i++;
            if(i % 4 == 0) {
                block.a = buf[3];
                block.b = buf[2];
                block.c = buf[1];
                block.d = buf[0];

                char *tmp;
                char chs[3];
                tmp = (char *)&block;
                chs[0] = tmp[2];
                chs[1] = tmp[1];
                chs[2] = tmp[0];
                fwrite(chs, 1, 3, wfile);
            }
            cout << tmp;
            //fputc(tmp, wfile);
        }
    }

    fclose(file);
    fclose(wfile);

    cout << endl;

    //没什么作用,表示结束了,打印下好看
    for(int i=0; i<65; i++) {
        cout << "=";
    }

    return 0;
}

有一点不足,文件最后会出现一次invalid char,可能是文件结束符eof吧,没管它,因为在那之前已经写入文件了。

转载于:https://my.oschina.net/lisanhu2015/blog/76499

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值