简介
base64模块是用来作base64编码解码,常用于小型数据的传输。编码后的数据是一个字符串,其包括a-z、A-Z、0-9、/、+共64个字符,即可用6个字节表示,写出数值就是0-63.故三个字节编码的话就变成了4个字节,如果数据字节数不是3的倍数,就不能精确地划分6位的块,此时需要在原数据后添加1个或2个零值字节,使其字节数为3的倍数,然后在编码后的字符串后添加1个或2个‘=’,表示零值字节,故事实上总共由65个字符组成。下面举几个小例子。
将3个字节的‘Xue‘进行base64编码:
将2个字节’Xu‘进行base64编码:
将1个字节’X'进行base64编码:
base64模块真正用的上的方法只有8个,分别是encode, decode, encodestring, decodestring, b64encode,b64decode, urlsafe_b64decode,urlsafe_b64encode。
他们8个可以两两分为4组:
1. encode,decode一组,专门用来编码和解码文件的,也可以StringIO里的数据做编解码;
2. encodestring,decodestring一组,专门用来编码和解码字符串;
3. b64encode和b64decode一组,用来编码和解码字符串,并且有一个替换符号字符的功能;4. urlsafe_b64encode和urlsafe_b64decode一组,这个就是用来专门对url进行base64编解码的。
代码示例
import base64
# 编码与解码的处理对象是byte,故对原数据要先编码,使原本的str类型变成byte
# 解码后直接输出来的是byte对象,故要解码成str对象。
st = 'hello world!'.encode() # 默认以utf8编码
res = base64.b64encode(st)
print(res.decode()) # 默认以utf8解码
res = base64.b64decode(res)
print(res.decode()) # 默认以utf8解码
运行结果:
aGVsbG8gd29ybGQh
hello world!