base64在CTF中的应用

最新推荐文章于 2024-08-10 10:50:21 发布

酸酸菜鱼

最新推荐文章于 2024-08-10 10:50:21 发布

阅读量1.6k

点赞数

本文链接：https://blog.csdn.net/lhk124/article/details/107567477

版权

Base64是一种基于64个可打印字符来表示二进制数据的表示方法。即将数据通过某些方式转换为64个可打印字符，用encode则转换成64个可打印字符串，反过来decode则是二进制数据。

数据转换方式：一个字符为8位，取其前6成一索引，找表，转为表中字符。2^6即64，故base64

1.base64算法python版。

CHARSET = "ASCII"
BASE_CHAR = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/" # 编码表
CHAR_PRE_GROUP = 3

def encode(msg):
    # 转为二进制
    b_msg = bytes(msg, CHARSET)
    # print("字节数:", len(b_msg))
    # 计算需要添加的 0 的个数
    zero_cnt = CHAR_PRE_GROUP - len(b_msg) % CHAR_PRE_GROUP
    if zero_cnt == CHAR_PRE_GROUP:
        zero_cnt = 0
    # print("需要添加的 0 的个数:", zero_cnt)
    msg += str(chr(0))*zero_cnt
    # print("Msg with zero:", msg)
    # 再一次转化为二进制
    b_msg = bytes(msg, CHARSET)
    # 三个一组，分组进行处理
    encoded = ""
    for i in range(0, len(b_msg), 3):
        i_msg =[int(i) for i in b_msg[i:i+3]]
        # print([bin(i) for i in i_msg])
        # 按照算法，将 3 字节变成 4 字节，位运算会比较绕
        new_msg = [None] * 4
        new_msg[0] = i_msg[0] >> 2
        new_msg[1] = (((i_msg[0] & 0b00000011) << 6) | (i_msg[1] >> 2)) >> 2
        new_msg[2] = (((i_msg[1] & 0b00001111) << 4) | (i_msg[2] >> 4)) >> 2
        new_msg[3] = i_msg[2] & 0b00111111
        
        #根据new_msg找到编码表的索引！
        encoded += "".join([BASE_CHAR[i] for i in new_msg])
    return encoded + '=' * zero_cnt

def decode(msg):
    zero_cnt = msg.count('=')
    # print("zero cnt:", zero_cnt)

    # remove =
    msg_without_zero = msg.replace('=', '')
    # 将字符转化为对应的索引值
    i_msg = [BASE_CHAR.index(i) for i in msg_without_zero]
    # 转化为 二进制
    decoded = ""
    for i in range(0, len(i_msg), 4):
        i_group_msg =[int(i) for i in i_msg[i:i+4]]
        # print([bin(i) for i in i_group_msg])
        # 将四字节转化为三字节
        original_msg = [None] * 3
        original_msg[0] = (i_group_msg[0] << 2) | ((i_group_msg[1] & 0b00110000) >> 4)
        original_msg[1]= ((i_group_msg[1] & 0b00001111) << 4) | ((i_group_msg[2] & 0b00111100) >> 2)
        original_msg[2]= ((i_group_msg[2] & 0b00000011) << 6) | i_group_msg[3]

        # print(original_msg)
        decoded += "".join([chr(i) for i in original_msg if i])
    # print(len(decoded))
    # print(decoded)
    return decoded


if __name__ == '__main__':
    def test(msg):
        emsg = encode(msg)
        print("Encoded", emsg)


        dmesg = decode(emsg)
        print("Decoded", dmesg)

    test("Hello")
    test("Hello1")

    test("Hello World")

2.python base64库的简单记录

base64/32/16之类的编码，是从RFC3248（https://tools.ietf.org/html/rfc3548.html）出来的。
RFC 3548 编码的目的是使得二进制数据可以作为电子邮件的内容正确地发送，用作 URL 的一部分，或者作为 HTTP POST 请求的一部分

base64.b64encode(s, altchars=None)
#使用base64编码。转换成base64的64个字符串
#s：需要编码的内容。
#altchars:可选参数,用于换编码表最后的字符+ / 不使用则使用默认编码表
# 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/'
#64可以换成32 16 85.即 b32encode b16encode

base64.b64decode(s, altchars=None, validate=False)
#s：同上
#altchars:同上
#validate:默认为False。如果 validate 值为 False （默认情况），则在填充检查前，将丢弃既不在标准 base-64 字母表之中也不在备用字母表中的字符。如果 validate 为 True，这些非 base64 字符将导致 binascii.Error。

其余库也差不多。感觉在CTF中没多大用处。有再补充！

3.在CTF中的使用

魔改算法。1.改编码表 (虽然’=‘是base64中的一个标志性符号，但最后两个符号是可改的)
2.不使用编码表。
3.对编码表进行拆分，分成多个部分
4.使用加解密处理编码表。
编码表^0x76。（或使用其他转换，但最终是原表）

4.解决方式

动态调试至解密函数，得到最终的编码表
使用ida脚本（直接写脚本）获取编码表及最终结果

题目1：https://blog.csdn.net/lhk124/article/details/107566739

题目2：打不开。不使用编码表的情况。

暂时到此。

4.补充base64 C语言版（他人的代码）

#pragma once
//
//  base64.h
//  base64
//
//  Created by guofu on 2017/5/25.
//  Copyright © 2017年 guofu. All rights reserved.
//

#ifndef base64_h
#define base64_h

#include <stdio.h>

#if __cplusplus
extern "C" {
#endif

	int base64_encode(const char *indata, int inlen, char *outdata, int *outlen);
	int base64_decode(const char *indata, int inlen, char *outdata, int *outlen);

#if __cplusplus
}
#endif

#endif /* base64_h */

//
//  base64.c
//  base64
//
//  Created by guofu on 2017/5/25.
//  Copyright © 2017年 guofu. All rights reserved.
//
/**
 *  转解码过程
 *  3 * 8 = 4 * 6; 3字节占24位, 4*6=24
 *  先将要编码的转成对应的ASCII值
 *  如编码: s 1 3
 *  对应ASCII值为: 115 49 51
 *  对应二进制为: 01110011 00110001 00110011
 *  将其6个分组分4组: 011100 110011 000100 110011
 *  而计算机是以8bit存储, 所以在每组的高位补两个0如下:
 *  00011100 00110011 00000100 00110011对应:28 51 4 51
 *  查找base64 转换表 对应 c z E z
 *
 *  解码
 *  c z E z
 *  对应ASCII值为 99 122 69 122
 *  对应表base64_suffix_map的值为 28 51 4 51
 *  对应二进制值为 00011100 00110011 00000100 00110011
 *  依次去除每组的前两位, 再拼接成3字节
 *  即: 01110011 00110001 00110011
 *  对应的就是s 1 3
 */

#include "base64.h"

#include <stdio.h>
#include <stdlib.h>

 // base64 转换表, 共64个
static const char base64_alphabet[] = {
	'A', 'B', 'C', 'D', 'E', 'F', 'G',
	'H', 'I', 'J', 'K', 'L', 'M', 'N',
	'O', 'P', 'Q', 'R', 'S', 'T',
	'U', 'V', 'W', 'X', 'Y', 'Z',
	'a', 'b', 'c', 'd', 'e', 'f', 'g',
	'h', 'i', 'j', 'k', 'l', 'm', 'n',
	'o', 'p', 'q', 'r', 's', 't',
	'u', 'v', 'w', 'x', 'y', 'z',
	'0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
	'+', '/' };

// 解码时使用
static const unsigned char base64_suffix_map[256] = {
	255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 253, 255,
	255, 253, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
	255, 255, 255, 255, 255, 255, 255, 255, 253, 255, 255, 255,
	255, 255, 255, 255, 255, 255, 255,  62, 255, 255, 255,  63,
	52,  53,  54,  55,  56,  57,  58,  59,  60,  61, 255, 255,
	255, 254, 255, 255, 255,   0,   1,   2,   3,   4,   5,   6,
	7,   8,   9,  10,  11,  12,  13,  14,  15,  16,  17,  18,
	19,  20,  21,  22,  23,  24,  25, 255, 255, 255, 255, 255,
	255,  26,  27,  28,  29,  30,  31,  32,  33,  34,  35,  36,
	37,  38,  39,  40,  41,  42,  43,  44,  45,  46,  47,  48,
	49,  50,  51, 255, 255, 255, 255, 255, 255, 255, 255, 255,
	255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
	255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
	255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
	255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
	255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
	255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
	255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
	255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
	255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
	255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
	255, 255, 255, 255 };

static char cmove_bits(unsigned char src, unsigned lnum, unsigned rnum) {
	src <<= lnum; // src = src << lnum;
	src >>= rnum; // src = src >> rnum;
	return src;
}

int base64_encode(const char *indata, int inlen, char *outdata, int *outlen) {

	int ret = 0; // return value
	if (indata == NULL || inlen == 0) {
		return ret = -1;
	}

	int in_len = 0; // 源字符串长度, 如果in_len不是3的倍数, 那么需要补成3的倍数
	int pad_num = 0; // 需要补齐的字符个数, 这样只有2, 1, 0(0的话不需要拼接, )
	if (inlen % 3 != 0) {
		pad_num = 3 - inlen % 3;
	}
	in_len = inlen + pad_num; // 拼接后的长度, 实际编码需要的长度(3的倍数)

	int out_len = in_len * 8 / 6; // 编码后的长度

	char *p = outdata; // 定义指针指向传出data的首地址

	//编码, 长度为调整后的长度, 3字节一组
	for (int i = 0; i < in_len; i += 3) {
		int value = *indata >> 2; // 将indata第一个字符向右移动2bit(丢弃2bit)
		char c = base64_alphabet[value]; // 对应base64转换表的字符
		*p = c; // 将对应字符(编码后字符)赋值给outdata第一字节

		//处理最后一组(最后3字节)的数据
		if (i == inlen + pad_num - 3 && pad_num != 0) {
			if (pad_num == 1) {
				*(p + 1) = base64_alphabet[(int)(cmove_bits(*indata, 6, 2) + cmove_bits(*(indata + 1), 0, 4))];
				*(p + 2) = base64_alphabet[(int)cmove_bits(*(indata + 1), 4, 2)];
				*(p + 3) = '=';
			}
			else if (pad_num == 2) { // 编码后的数据要补两个 '='
				*(p + 1) = base64_alphabet[(int)cmove_bits(*indata, 6, 2)];
				*(p + 2) = '=';
				*(p + 3) = '=';
			}
		}
		else { // 处理正常的3字节的数据
			*(p + 1) = base64_alphabet[cmove_bits(*indata, 6, 2) + cmove_bits(*(indata + 1), 0, 4)];
			*(p + 2) = base64_alphabet[cmove_bits(*(indata + 1), 4, 2) + cmove_bits(*(indata + 2), 0, 6)];
			*(p + 3) = base64_alphabet[*(indata + 2) & 0x3f];
		}

		p += 4;
		indata += 3;
	}

	if (outlen != NULL) {
		*outlen = out_len;
	}

	return ret;
}


int base64_decode(const char *indata, int inlen, char *outdata, int *outlen) {

	int ret = 0;
	if (indata == NULL || inlen <= 0 || outdata == NULL || outlen == NULL) {
		return ret = -1;
	}
	if (inlen % 4 != 0) { // 需要解码的数据不是4字节倍数
		return ret = -2;
	}

	int t = 0, x = 0, y = 0, i = 0;
	unsigned char c = 0;
	int g = 3;

	while (indata[x] != 0) {
		// 需要解码的数据对应的ASCII值对应base64_suffix_map的值
		c = base64_suffix_map[indata[x++]];
		if (c == 255) return -1;// 对应的值不在转码表中
		if (c == 253) continue;// 对应的值是换行或者回车
		if (c == 254) { c = 0; g--; }// 对应的值是'='
		t = (t << 6) | c; // 将其依次放入一个int型中占3字节
		if (++y == 4) {
			outdata[i++] = (unsigned char)((t >> 16) & 0xff);
			if (g > 1) outdata[i++] = (unsigned char)((t >> 8) & 0xff);
			if (g > 2) outdata[i++] = (unsigned char)(t & 0xff);
			y = t = 0;
		}
	}
	if (outlen != NULL) {
		*outlen = i;
	}
	return ret;
}

//
//  main.c
//  base64
//
//  Created by guofu on 2017/5/25.
//  Copyright © 2017年 guofu. All rights reserved.
//

#include <stdio.h>
#include <string.h>

#include "base64.h"

int main(int argc, const char * argv[]) {
	// insert code here...

	char str1[] = "abcdefg";
	char str2[20] = { 0 }; //注意长度要给够
	int len = 0;
	base64_encode(str1, (int)strlen(str1), str2, &len);
	printf("%s, len = %d\n", str2, len);


	char str3[10] = { 0 };
	base64_decode(str2, (int)strlen(str2), str3, &len);

	printf("%s, len = %d\n", str3, len);


	return 0;
}