Base 64 原理
Base64的加密方式是将三个八位的字节转化为四个六位的字节,不足八位的高位补0,3*8 = 4*6 ,所以经过base6加密的字符串大约比要比未加密的字符串要大三分之一。
大小写的字母26*2 加上10个数字 加上两个特殊符号 + / 一共64个字符,因为Base64有效位只有六位,所以最大能表示的字符就为2的6次方64;
举例:加密“ace”,
ace转化为二进制为:01100001 01100011 01100101
转化为base64的四字节六位:011000 010110 001101 100101
那因为计算机是一字节八位的存数,所以高位补00后变为:00011000 00010110 00001101 00100101
转化为十进制:24 22 13 37
通过查表,我们得到最终结果:YWNl
在base64末尾的加等号
例子中为了方便演示我只取了三个字节的字符串,实际中会存在字节数量不是3倍数的情况,Base64是这样处理的:
将原ASCII码(每个字符8位)转换为转换为base编码字符,会存在两种情况。一是剩余一个ASCII码,余数为1,这时候添加两个等号,因为一个8位的字符至少可以变成两个6位的base64字符,这样可以补满4个base64字节。当余数为2时,只需要添加一个等号,因为两8位的字符至少可以变成三个6位的base64字符。
url encode
标准的Base64并不适合直接放在URL里传输,因为URL编码器会把标准Base64中的“/”和“+”字符变为形如“%XX”的形式,而这些“%”号在存入数据库时还需要再进行转换,因为ANSI SQL中已将“%”号用作通配符。
为解决此问题,可采用一种用于URL的改进Base64编码,它不仅在末尾去掉填充的’='号,并将标准Base64中的“+”和“/”分别改成了“-”和“_”,这样就免去了在URL编解码和数据库存储时所要作的转换。