Base64编码是一种将二进制数据转换为ASCII字符串格式的方法,使用特定的64个字符集。其编码过程如下:
-
输入数据:将二进制数据作为输入。
-
分组:将输入数据按3字节(24位)一组进行分组。
-
拆分:每组24位数据被拆分成四个6位的组。
-
映射:每个6位组映射到Base64字母表中的一个字符,该字母表包含64个字符(A-Z, a-z, 0-9, +, /)。
-
填充:如果输入数据的字节数不是3的倍数,则在最终编码输出中添加填充字符(
=
),使其长度成为4的倍数。
代码:
#include <iostream>
#include <string>
//base64字符表
static const std::string base64_chars =
"ABCDEFGHIJKLMNOPQRSTUVWXYZ"
"abcdefghijklmnopqrstuvwxyz"
"0123456789+/";
//编码
std::string base64_encode(unsigned char const* bytes_to_encode, unsigned int in_len)
{
std::string ret;
int i = 0;
int j = 0;
unsigned char char_array_3[3];
unsigned char char_array_4[4];
while (in_len--) {
char_array_3[i++] = *(bytes_to_encode++);//每次取出三个bytes
if (i == 3) {
/*取第一个byte的高六位*/
char_array_4[0] = (char_array_3[0] & 0xfc) >> 2;
/*取第一个byte的底二位*/ /*取第二个byte的高四位*/
char_array_4[1] = ((char_array_3[0] & 0x03) << 4) + ((char_array_3[1] & 0xf0) >> 4);
/*取第二个byte的底二位*/ /*取第三个byte的高四位*/
char_array_4[2] = ((char_array_3[1] & 0x0f) << 2) + ((char_array_3[2] & 0xc0) >> 6);
/*取第三个byte的底六位*/
char_array_4[3] = char_array_3[2] & 0x3f;
for(i = 0; (i <4) ; i++)//四个六位byte, 2^6=64 ,从base64表里面查下标对应的字符
ret += base64_chars[char_array_4[i]];
i = 0;
}
}
if (i)//bytes不是3的倍数时
{
for(j = i; j < 3; j++)//填充0凑够倍数
char_array_3[j] = '\0';
//剩余的byte继续编码
char_array_4[0] = (char_array_3[0] & 0xfc) >> 2;
char_array_4[1] = ((char_array_3[0] & 0x03) << 4) + ((char_array_3[1] & 0xf0) >> 4);
char_array_4[2] = ((char_array_3[1] & 0x0f) << 2) + ((char_array_3[2] & 0xc0) >> 6);
char_array_4[3] = char_array_3[2] & 0x3f;
// 这里 i+1 byte编码总有低位在下一个char_array_4中
for (j = 0; (j < i + 1); j++)
ret += base64_chars[char_array_4[j]];
//剩余没有编码的填充=
while((i++ < 3))
ret += '=';
}
return ret;
}
std::string base64_encode(const std::string &str)
{
return base64_encode(reinterpret_cast<const unsigned char*>(str.c_str()), static_cast<unsigned int>(str.size()));
}
static inline bool is_base64(unsigned char c) {
return (isalnum(c) || (c == '+') || (c == '/'));
}
//解码
std::string base64_decode(std::string const& encoded_string)
{
int in_len = encoded_string.size();
int i = 0;
int j = 0;
int in_ = 0;
unsigned char char_array_4[4], char_array_3[3];
std::string ret;
while (in_len-- && (encoded_string[in_] != '=') && is_base64(encoded_string[in_]))
{
char_array_4[i++] = encoded_string[in_];
in_++;
if (i == 4)//四个base64字符为一组
{
//找到对应base64字符在base64的下标值
for (i = 0; i < 4; i++)
char_array_4[i] = base64_chars.find(char_array_4[i]);
//通过下标值移位还原原来字符串字符对应的值
char_array_3[0] = (char_array_4[0] << 2) + ((char_array_4[1] & 0x30) >> 4);
char_array_3[1] = ((char_array_4[1] & 0xf) << 4) + ((char_array_4[2] & 0x3c) >> 2);
char_array_3[2] = ((char_array_4[2] & 0x3) << 6) + char_array_4[3];
for (i = 0; (i < 3); i++)
ret += char_array_3[i];
i = 0;
}
}
if (i) //填充的=最后处理
{
for (j = i; j < 4; j++)
char_array_4[j] = 0;
for (j = 0; j < i ; j++)
{
char_array_4[j] = base64_chars.find(char_array_4[j]);
}
char_array_3[0] = (char_array_4[0] << 2) + ((char_array_4[1] & 0x30) >> 4);
char_array_3[1] = ((char_array_4[1] & 0xf) << 4) + ((char_array_4[2] & 0x3c) >> 2);
char_array_3[2] = ((char_array_4[2] & 0x3) << 6) + char_array_4[3];
for (j = 0; (j < i - 1); j++) ret += char_array_3[j];
}
return ret;
}
int main()
{ /* 有内鬼终止交易! */
std::string str = "A mole pulled the plug on the deal ! ";
std::string base64 = base64_encode(str);
std::cout <<"self: " << str <<std::endl;
std::cout << "tobase64: " << base64 << std::endl;
std::cout << "frombase64: " << base64_decode(base64) << std::endl;
return 0;
}