Base64是一种基于64个可打印字符来表示二进制数据的表示方法,从本质上看Base64编码就是将三字节转四字节。如将字符串“Man”用Base64编码。
如果数据的长度不是3的整数倍,就要在后面补0再计算,每补2个0就再Base64串后加上1个‘=’。
Base64编码表如下:
Base64的不足之处
标准的Base64并不适合直接放在URL里传输,因为URL编码器会把标准Base64中的“/”和“+”字符变为形如“%XX”的形式,而这些“%”号在存入数据库时还需要再进行转换,因为ANSI SQL中已将“%”号用作通配符。
为解决此问题,可采用一种用于URL的改进Base64编码,它不在末尾填充'='号,并将标准Base64中的“+”和“/”分别改成了“-”和“_”,这样就免去了在URL编解码和数据库存储时所要作的转换,避免了编码信息长度在此过程中的增加,并统一了数据库、表单等处对象标识符的格式。
在python中使用base64编码和解码都是非常方便的,在import base64模块后直接使用encodestring()和decodestring()就可以了,先使用基于URL的改进Base64编码的同样方便,python已经提供了urlsafe_b64encode()urlsafe_b64decode()供使用。
下面给出python的示范代码:
- # http://blog.csdn.net/morewindows/article/details/11922473
- # By MoreWindows ( http://blog.csdn.net/MoreWindows )
- # more info please visit http://www.python.org/doc//current/library/base64.html
- import base64
- text = "MoreWindows - http://blog.csdn.net/morewindows?viewmode=contents ~!@#$%"
- # encodestring(string) and decodestring(string)
- print "------------------------------------"
- print "origin text: "
- print text
- base64_text = base64.encodestring(text)
- print "encode: "
- print base64_text
- print "decode: "
- print base64.decodestring(base64_text)
- print "------------------------------------"
- # urlsafe_b64encode(string) and urlsafe_b64decode(string)
- print "------------------------------------"
- print "origin text: "
- print text
- urlsafe_base64_text = base64.urlsafe_b64encode(text)
- print "url safe encode: "
- print urlsafe_base64_text
- print "url safe decode: "
- print base64.urlsafe_b64decode(urlsafe_base64_text)
- print "------------------------------------"
运行结果如下:
要对文件操作该怎么办了,python也提供了相应的接口,示范代码如下:
- # http://blog.csdn.net/morewindows/article/details/11922473
- # By MoreWindows ( http://blog.csdn.net/MoreWindows )
- # more info please visit http://www.python.org/doc//current/library/base64.html
- # base64.encode(file1, file2)
- f1 = open('aaa.txt', 'r')
- f2 = open('bbb.txt', 'w')
- base64.encode(f1, f2)
最后注意在html5中生成的图片base64 会加上data:image/png;base64,前缀,导致转换失败,需要先去除