1.base64
bse64是一种以64个可见字符集对二进制数据进行编码的编码算法。
1.1应用范围
base64常用于网络数据传输过程的编解码环节。HTTP环境下传递较长的标识信息。例如,在Java Persistence系统Hibernate中,就采用了base64来将一个较长的一个标识符(一般为128-bit的UUID)编码为一个字符串,用作HTTP表单和HTTP GET URL中的参数。在其他应用程序中,也常常需要把二进制数据编码为适合放在URL(包括隐藏表单域)中的形式。此时,采用Base64编码不仅比较简短,同时也具有不可读性,即所编码的数据不会被人用肉眼所直接看到 [引用百度百科] 。
【1】电子邮件加密;
【2】数据加密;
【3】采用base64来规避反垃圾邮件工具,因为那些工具通常都不会翻译base64的讯息;
【4】图片、文件网络传输。
1.2编码表
bse64编码表是64个可见字符集。
1.3编码过程
base64编码,每3个8位明文数据为一组,取这3个字数据的ASCII码,然后以6位为一组组成4个新的数据。对于不足3字节的处理:
【1】不足三字节后面填充0;
【2】对于编码前的数据产生的6位,如果为0,则索引到的字符为‘A’;因不足3字节而填充的0,用’=’来替代,有点结束符的意思。
例如对“ABCD”进行base64编码:
对于不足6位的补零(图中浅红色的4位),索引为“A”;对于最后不足3字节,进行补零处理(图中红色部分),以“=”替代,因此,“ABCD”的base64编码为:“QUJDRA==”。
1.4解码过程
base64解码,即是base64编码的逆过程,如果理解了编过过程,解码过程也就容易理解。将base64编码数据根据编码表分别索引到编码值,然后每4个编码值一组组成一个24位的数据流,解码为3个字符。对于末尾位“=”的base64数据,最终取得的4字节数据,需要去掉“=”再进行转换。
解码过程可以参考上图,逆向理解:“QUJDRA==” ——>“ABCD”
2.实现
base64应用范围很广,因此很多编程语言的标准库都提供base64编解码库,如PHP、Python等,一般不需重复造轮子,但能够重复造一遍轮子,会理解更透彻。
(1) C语言版
#include <stdint.h>
#include <stdbool.h>
#include <stdlib.h>
#include <string.h>
#include <stdio.h>
const char *base64_table="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"; /* base64编码表 */
static int num_strchr(const char *str, char c)
{
const char *p = strchr(str, c);
if (NULL == p)
{
return -1;
}
return p - str;
}
uint32_t base64_get_dest_len(uint32_t src_len)
{
return 4 * ((src_len+2)/3);
}
uint32_t src_get_dest_len(uint32_t base64_len)
{
return base64_len/4*3 - 2;
}
int base64_encode(const char *src_str, uint32_t src_len, char *dest_str, uint32_t dest_len)
{
uint32_t i,j,len;
len = base64_get_dest_len(src_len);
if(dest_len < len)
{/* 空间不足 */
return -1;
}
for(i=0; i<src_len/3; i++)
{
*dest_str++ =base64_table[(src_str[0]>>2) & 0x3f]; /* 取第一字符前6bit */
*dest_str++ =base64_table[((src_str[0]<<4) & 0x30) | ((src_str[1]>>4) & 0x0f)]; /* 第一字符的后2bit与第二字符的前4位进行合并 */
*dest_str++ =base64_table[((src_str[1]<<2) & 0x3c) | ((src_str[2]>>6) & 0x03)]; /* 将第二字符的后4bit与第三字符的前2bit组合并 */
*dest_str++ =base64_table[src_str[2] & 0x3f]; /* 取第三字符的后6bit */
src_str += 3;
}
/* 非3的整数倍补“=” */
if((src_len%3) == 1)
{
*dest_str++ =base64_table[(src_str[0]>>2) & 0x3f];
*dest_str++ =base64_table[((src_str[0]<<4) & 0x30) | ((src_str[1]>>4) & 0x0f)];
*dest_str++ ='=';
*dest_str++ ='=';
}
else if((src_len%3) == 2)
{
*dest_str++ =base64_table[(src_str[0]>>2) & 0x3f];
*dest_str++ =base64_table[((src_str[0]<<4) & 0x30) | ((src_str[1]>>4) & 0x0f)];
*dest_str++ =base64_table[(src_str[j+1]<<2) & 0x3c];
*dest_str++ ='=';
}
*dest_str = '\0';
return 0;
}
int base64_decode(const char *src_str, uint32_t src_len, char *dest_str, uint32_t dest_len)
{
uint32_t i = 0;
char buf[4] = {0};
if (dest_len < src_get_dest_len(src_len))
{
return -1;
}
for (; (src_str[i]!='\0') && (i<src_len); i+=4)
{
/* 四个码译成三个字符 */
buf[0] = num_strchr(base64_table, src_str[i]);
buf[1] = num_strchr(base64_table, src_str[i+1]);
*dest_str++ = ((buf[0] << 2) & 0xfc) | ((buf[1]>>4) & 0x03);
if (src_str[i+2] == '=')
{
break;
}
buf[2] = num_strchr(base64_table, src_str[i + 2]);
*dest_str++ = ((buf[1] << 4) & 0xf0) | ((buf[2] >> 2) & 0x0f);
if (src_str[i + 3] == '=')
{
break;
}
buf[3] = num_strchr(base64_table, src_str[i + 3]);
*dest_str++ = ((buf[2] << 6) & 0xc0) | (buf[3] & 0x3f);
}
*dest_str = '\0';
return 0;
}
int main(int argc,char **argv)
{
char *buf = NULL;
uint32_t dest_len,src_len;
if(argc < 3)
return -1;
if(strcmp(argv[1],"decode") == 0)
{
src_len = strlen(argv[2]);
dest_len = src_get_dest_len(src_len);
buf = (char*)malloc(dest_len);
if(buf == NULL)
return -1;
base64_decode(argv[2], src_len, buf, dest_len);
printf("base64 str:%s\n",argv[2]);
printf("base64_decode str:%s\n",buf);
}
else if(strcmp(argv[1],"encode") == 0)
{
src_len = strlen(argv[2]);
dest_len = base64_get_dest_len(src_len);
buf = (char*)malloc(dest_len);
if(buf == NULL)
return -1;
base64_encode(argv[2], src_len, buf, dest_len);
printf("src str:%s\n",argv[2]);
printf("base64_encode str:%s\n",buf);
}
free(buf);
buf = NULL;
return 0;
}
编译测试:
base64加密/解密在线工具 http://tool.chinaz.com/Tools/Base64.aspx