Base64是一种基于64个可打印字符来表示二进制数据的表示方法。即将数据通过某些方式转换为64个可打印字符,用encode则转换成64个可打印字符串,反过来decode则是二进制数据。
数据转换方式:一个字符为8位,取其前6成一索引,找表,转为表中字符。2^6即64,故base64
1.base64算法python版。
CHARSET = "ASCII"
BASE_CHAR = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/" # 编码表
CHAR_PRE_GROUP = 3
def encode(msg):
# 转为二进制
b_msg = bytes(msg, CHARSET)
# print("字节数:", len(b_msg))
# 计算需要添加的 0 的个数
zero_cnt = CHAR_PRE_GROUP - len(b_msg) % CHAR_PRE_GROUP
if zero_cnt == CHAR_PRE_GROUP:
zero_cnt = 0
# print("需要添加的 0 的个数:", zero_cnt)
msg += str(chr(0))*zero_cnt
# print("Msg with zero:", msg)
# 再一次转化为二进制
b_msg = bytes(msg, CHARSET)
# 三个一组,分组进行处理
encoded = ""
for i in range(0, len(b_msg), 3):
i_msg =[int(i) for i in b_msg[i:i+3]]
# print([bin(i) for i in i_msg])
# 按照算法,将 3 字节变成 4 字节,位运算会比较绕
new_msg = [None] * 4
new_msg[0] = i_msg[0] >> 2
new_msg[1] = (((i_msg[0] & 0b00000011) << 6) | (i_msg[1] >> 2)) >> 2
new_msg[2] = (((i_msg[1] & 0b00001111) << 4) | (i_msg[2] >> 4)) >> 2
new_msg[3] = i_msg[2] & 0b00111111
#根据new_msg找到编码表的索引!
encoded += "".join([BASE_CHAR[i] for i in new_msg])
return encoded + '=' * zero_cnt
def decode(msg):
zero_cnt = msg.count('=')
# print("zero cnt:", zero_cnt)
# remove =
msg_without_zero = msg.replace('=', '')
# 将字符转化为对应的索引值
i_msg = [BASE_CHAR.index(i) for i in msg_without_zero]
# 转化为 二进制
decoded = ""
for i in range(0, len(i_msg), 4):
i_group_msg =[int(i) for i in i_msg[i:i+4]]
# print([bin(i) for i in i_group_msg])
# 将四字节转化为三字节
original_msg = [None] * 3
original_msg[0] = (i_group_msg[0] << 2) | ((i_group_msg[1] & 0b00110000) >> 4)
original_msg[1]= ((i_group_msg[1] & 0b00001111) << 4) | ((i_group_msg[2] & 0b00111100) >> 2)
original_msg[2]= ((i_group_msg[2] & 0b00000011) << 6) | i_group_msg[3]
# print(original_msg)
decoded += "".join([chr(i) for i in original_msg if i])
# print(len(decoded))
# print(decoded)
return decoded
if __name__ == '__main__':
def test(msg):
emsg = encode(msg)
print("Encoded", emsg)
dmesg = decode(emsg)
print("Decoded", dmesg)
test("Hello")
test("Hello1")
test("Hello World")
2.python base64库的简单记录
base64/32/16之类的编码,是从RFC3248(https://tools.ietf.org/html/rfc3548.html)出来的。
RFC 3548 编码的目的是使得二进制数据可以作为电子邮件的内容正确地发送,用作 URL 的一部分,或者作为 HTTP POST 请求的一部分
base64.b64encode(s, altchars=None)
#使用base64编码。转换成base64的64个字符串
#s:需要编码的内容。
#altchars:可选参数,用于换编码表最后的字符+ / 不使用则使用默认编码表
# 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/'
#64可以换成32 16 85.即 b32encode b16encode
base64.b64decode(s, altchars=None, validate=False)
#s:同上
#altchars:同上
#validate:默认为False。如果 validate 值为 False (默认情况),则在填充检查前,将丢弃既不在标准 base-64 字母表之中也不在备用字母表中的字符。如果 validate 为 True,这些非 base64 字符将导致 binascii.Error。
其余库也差不多。感觉在CTF中没多大用处。有再补充!
3.在CTF中的使用
- 魔改算法。1.改编码表 (虽然’=‘是base64中的一个标志性符号,但最后两个符号是可改的)
- 2.不使用编码表。
- 3.对编码表进行拆分,分成多个部分
- 4.使用加解密处理编码表。
- 编码表^0x76。(或使用其他转换,但最终是原表)
4.解决方式
- 动态调试至解密函数,得到最终的编码表
- 使用ida脚本(直接写脚本)获取编码表及最终结果
题目1:https://blog.csdn.net/lhk124/article/details/107566739
题目2:打不开。不使用编码表的情况。
暂时到此。
4.补充base64 C语言版(他人的代码)
#pragma once
//
// base64.h
// base64
//
// Created by guofu on 2017/5/25.
// Copyright © 2017年 guofu. All rights reserved.
//
#ifndef base64_h
#define base64_h
#include <stdio.h>
#if __cplusplus
extern "C" {
#endif
int base64_encode(const char *indata, int inlen, char *outdata, int *outlen);
int base64_decode(const char *indata, int inlen, char *outdata, int *outlen);
#if __cplusplus
}
#endif
#endif /* base64_h */
//
// base64.c
// base64
//
// Created by guofu on 2017/5/25.
// Copyright © 2017年 guofu. All rights reserved.
//
/**
* 转解码过程
* 3 * 8 = 4 * 6; 3字节占24位, 4*6=24
* 先将要编码的转成对应的ASCII值
* 如编码: s 1 3
* 对应ASCII值为: 115 49 51
* 对应二进制为: 01110011 00110001 00110011
* 将其6个分组分4组: 011100 110011 000100 110011
* 而计算机是以8bit存储, 所以在每组的高位补两个0如下:
* 00011100 00110011 00000100 00110011对应:28 51 4 51
* 查找base64 转换表 对应 c z E z
*
* 解码
* c z E z
* 对应ASCII值为 99 122 69 122
* 对应表base64_suffix_map的值为 28 51 4 51
* 对应二进制值为 00011100 00110011 00000100 00110011
* 依次去除每组的前两位, 再拼接成3字节
* 即: 01110011 00110001 00110011
* 对应的就是s 1 3
*/
#include "base64.h"
#include <stdio.h>
#include <stdlib.h>
// base64 转换表, 共64个
static const char base64_alphabet[] = {
'A', 'B', 'C', 'D', 'E', 'F', 'G',
'H', 'I', 'J', 'K', 'L', 'M', 'N',
'O', 'P', 'Q', 'R', 'S', 'T',
'U', 'V', 'W', 'X', 'Y', 'Z',
'a', 'b', 'c', 'd', 'e', 'f', 'g',
'h', 'i', 'j', 'k', 'l', 'm', 'n',
'o', 'p', 'q', 'r', 's', 't',
'u', 'v', 'w', 'x', 'y', 'z',
'0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
'+', '/' };
// 解码时使用
static const unsigned char base64_suffix_map[256] = {
255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 253, 255,
255, 253, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
255, 255, 255, 255, 255, 255, 255, 255, 253, 255, 255, 255,
255, 255, 255, 255, 255, 255, 255, 62, 255, 255, 255, 63,
52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 255, 255,
255, 254, 255, 255, 255, 0, 1, 2, 3, 4, 5, 6,
7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18,
19, 20, 21, 22, 23, 24, 25, 255, 255, 255, 255, 255,
255, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36,
37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48,
49, 50, 51, 255, 255, 255, 255, 255, 255, 255, 255, 255,
255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255, 255,
255, 255, 255, 255 };
static char cmove_bits(unsigned char src, unsigned lnum, unsigned rnum) {
src <<= lnum; // src = src << lnum;
src >>= rnum; // src = src >> rnum;
return src;
}
int base64_encode(const char *indata, int inlen, char *outdata, int *outlen) {
int ret = 0; // return value
if (indata == NULL || inlen == 0) {
return ret = -1;
}
int in_len = 0; // 源字符串长度, 如果in_len不是3的倍数, 那么需要补成3的倍数
int pad_num = 0; // 需要补齐的字符个数, 这样只有2, 1, 0(0的话不需要拼接, )
if (inlen % 3 != 0) {
pad_num = 3 - inlen % 3;
}
in_len = inlen + pad_num; // 拼接后的长度, 实际编码需要的长度(3的倍数)
int out_len = in_len * 8 / 6; // 编码后的长度
char *p = outdata; // 定义指针指向传出data的首地址
//编码, 长度为调整后的长度, 3字节一组
for (int i = 0; i < in_len; i += 3) {
int value = *indata >> 2; // 将indata第一个字符向右移动2bit(丢弃2bit)
char c = base64_alphabet[value]; // 对应base64转换表的字符
*p = c; // 将对应字符(编码后字符)赋值给outdata第一字节
//处理最后一组(最后3字节)的数据
if (i == inlen + pad_num - 3 && pad_num != 0) {
if (pad_num == 1) {
*(p + 1) = base64_alphabet[(int)(cmove_bits(*indata, 6, 2) + cmove_bits(*(indata + 1), 0, 4))];
*(p + 2) = base64_alphabet[(int)cmove_bits(*(indata + 1), 4, 2)];
*(p + 3) = '=';
}
else if (pad_num == 2) { // 编码后的数据要补两个 '='
*(p + 1) = base64_alphabet[(int)cmove_bits(*indata, 6, 2)];
*(p + 2) = '=';
*(p + 3) = '=';
}
}
else { // 处理正常的3字节的数据
*(p + 1) = base64_alphabet[cmove_bits(*indata, 6, 2) + cmove_bits(*(indata + 1), 0, 4)];
*(p + 2) = base64_alphabet[cmove_bits(*(indata + 1), 4, 2) + cmove_bits(*(indata + 2), 0, 6)];
*(p + 3) = base64_alphabet[*(indata + 2) & 0x3f];
}
p += 4;
indata += 3;
}
if (outlen != NULL) {
*outlen = out_len;
}
return ret;
}
int base64_decode(const char *indata, int inlen, char *outdata, int *outlen) {
int ret = 0;
if (indata == NULL || inlen <= 0 || outdata == NULL || outlen == NULL) {
return ret = -1;
}
if (inlen % 4 != 0) { // 需要解码的数据不是4字节倍数
return ret = -2;
}
int t = 0, x = 0, y = 0, i = 0;
unsigned char c = 0;
int g = 3;
while (indata[x] != 0) {
// 需要解码的数据对应的ASCII值对应base64_suffix_map的值
c = base64_suffix_map[indata[x++]];
if (c == 255) return -1;// 对应的值不在转码表中
if (c == 253) continue;// 对应的值是换行或者回车
if (c == 254) { c = 0; g--; }// 对应的值是'='
t = (t << 6) | c; // 将其依次放入一个int型中占3字节
if (++y == 4) {
outdata[i++] = (unsigned char)((t >> 16) & 0xff);
if (g > 1) outdata[i++] = (unsigned char)((t >> 8) & 0xff);
if (g > 2) outdata[i++] = (unsigned char)(t & 0xff);
y = t = 0;
}
}
if (outlen != NULL) {
*outlen = i;
}
return ret;
}
//
// main.c
// base64
//
// Created by guofu on 2017/5/25.
// Copyright © 2017年 guofu. All rights reserved.
//
#include <stdio.h>
#include <string.h>
#include "base64.h"
int main(int argc, const char * argv[]) {
// insert code here...
char str1[] = "abcdefg";
char str2[20] = { 0 }; //注意长度要给够
int len = 0;
base64_encode(str1, (int)strlen(str1), str2, &len);
printf("%s, len = %d\n", str2, len);
char str3[10] = { 0 };
base64_decode(str2, (int)strlen(str2), str3, &len);
printf("%s, len = %d\n", str3, len);
return 0;
}