项目开发的过程中,使用CLIPS构建规则引擎中对定义的用户函数传送字符参数的时候,如果参数中出现“或者”时候,会直接导致整个插入的的规则错误。而Base64刚好能帮助解决这个问题,因为经过base64转换后的字符串中必定不包含这两个字符。发现这种编码方式,不但可以解决本项目中的问题,还可以解决其他数据传输过程中遇到的字符串问题。所以,有了下文。
Base64通过64个可打印字符集来表示6bit二进制数据。将要转换的字符的二进制流,每次取6个bit进行转换。大家都知道6个bit的二进制数据,可以表示的最大数是63,所以它可以表示0-63。转换后得到0-63中的整数后,通过以这个整数为下标,到base64支持的64个可打印字符数组中找到对应的表达字符,迭代进行。其过程,大概如此。
Base64支持的64个可打印字符是什么?
Base64支持的可打印字符为“ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/”, 字母表中的26个英文字母的大小写加上0-9的十个数外加“=”和“/”,构成了这么64个可打印字符集合。另外,因为一个 字符8个位,在进行base64转换的过程中,我们需要三个字符一转。对于不够的后面补0.若最后剩余一个字符的话, 再加4个位的0 构成12个位,然后在加上两个”=“,若最后剩余两个字符的时候,则再加2个位的0,构成18个位,然后 再在字符的末尾加上一个”=“。
Base64主要包含两个算法,一个生成base64字符串和一个解析base64字符串,当且成为加密或者解密。对于加密算法的详细描述如下:
STEPS:
1. 将三个byte的数据,先后放入一个24bit的缓冲区中,先来的byte占高位。数据不足3byte的话,于缓冲区中剩下的bit用0补足。
2. 然后,每次取出6(因为)个bit,按照其值选择 ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/中的字符作为编码后的输出。
不断进行,直到全部输入数据转换完成。
3. 当原数据长度不是3的整数倍时, 如果最后剩下两个输入数据,在编码结果后加1个“=”;如果最后剩下一个输入数 据,编码结果后加2个“=”;如果没有剩下任何数据,就什么都不要加,这样才可以保证资料还原的正确性。
加密代码实现如下:
tatic const std::string Base64_Const = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
std::string Base64_Encode(const std::string & input_str, unsigned int len)
{
unsigned char base64_str_t[4];
unsigned char base_char_t[3];
std::string tmp_str;
int i = 0;
for (int j = 0; j < len; j++)
{
base_char_t[i++] = input_str[j];
if (i == 3)
{
base64_str_t[0] = ((base_char_t[0] & 0xfc) >> 2);
base64_str_t[1] = ((base_char_t[0] & 0x03) << 4) | ((base_char_t[1] & 0xf0) >> 4);
base64_str_t[2] = ((base_char_t[1] & 0x0f) << 2) | ((base_char_t[2] & 0xc0) >> 6);
base64_str_t[3] = ((base_char_t[2] & 0x3f));
i = 0;
for (int k = 0; k < 4; k++)
{
tmp_str += Base64_Const[base64_str_t[k]];
}
}
}
if (i > 0)
{
for (int m = i; m < 3; m++)
{
base_char_t[m] = 0;
}
base64_str_t[0] = ((base_char_t[0] & 0xfc) >> 2);
base64_str_t[1] = ((base_char_t[0] & 0x03) << 4) | ((base_char_t[1] & 0xf0) >> 4);
base64_str_t[2] = ((base_char_t[1] & 0x0f) << 2) | ((base_char_t[2] & 0xc0) >> 6);
base64_str_t[3] = ((base_char_t[2] & 0x3f));
if (i == 1)
{
tmp_str += Base64_Const[base64_str_t[0]];
tmp_str += Base64_Const[base64_str_t[1]];
tmp_str += "=";
tmp_str += "=";
}
else if (i == 2)
{
tmp_str += Base64_Const[base64_str_t[0]];
tmp_str += Base64_Const[base64_str_t[1]];
tmp_str += Base64_Const[base64_str_t[2]];
tmp_str += "=";
}
}
return tmp_str;
}
BASE64的解密算法则与加密想法。
STEPS:
1. base64表示的字符串,若末尾有”=“,则去掉”=“,根据base64可表示的字符数组的下标值,获取base64表示的字符对应的位置字符,组成字符串,作为下面的输入,取名为input_str。
2. 取input_str字符8个bit中低位的6个bit,放入二进制缓冲区。
3. 在二进制缓冲区中二进制流中,每隔8个位转换为一个字符,不足8个位的补0。
解密代码实现如下:
std::string Base64_Decode(const std::string &base64_str)
{
unsigned char base64_str_t[4];
unsigned char base_char_t[3];
std::string tmp_str;
int len = base64_str.find("=");
if (len < 0)
{
len = base64_str.length();
}
int i = 0;
for (int j = 0; j < len; j++)
{
base64_str_t[i++] = Base64_Const.find(base64_str[j]);
if (i == 4)
{
base_char_t[0] = ((base64_str_t[0] & 0x3f) << 2) | ((base64_str_t[1] & 0x30) >> 4);
base_char_t[1] = ((base64_str_t[1] & 0x0f) << 4) | ((base64_str_t[2] & 0x3c) >> 2);
base_char_t[2] = ((base64_str_t[2] & 0x03) << 6) | (base64_str_t[3] & 0x3f);
i = 0;
for (int k = 0; k < 3; k++)
{
tmp_str += base_char_t[k];
}
}
}
if (i > 0)
{
for (int m = i; m < 4; m++)
{
base64_str_t[m] = 0;
}
base_char_t[0] = ((base64_str_t[0] & 0x3f) << 2) | ((base64_str_t[1] & 0x30) >> 4);
base_char_t[1] = ((base64_str_t[1] & 0x0f) << 4) | ((base64_str_t[2] & 0x3c) >> 2);
base_char_t[2] = ((base64_str_t[2] & 0x03) << 6) | (base64_str_t[3] & 0x3f);
for (int k = 0; k < 3; k++)
{
tmp_str += base_char_t[k];
}
}
return tmp_str;
}