Python 3最重要的新特性之一是对字符串和二进制数据流做了明确的区分。文本总是Unicode,由str类型表示,二进制数据则由bytes类型表示。Python 3不会以任意隐式的方式混用str和bytes,你不能拼接字符串和字节流,也无法在字节流里搜索字符串(反之亦然),也不能将字符串传入参数为字节流的函数(反之亦然)。
1. bytes类型转为str类型
方法一:利用str函数
方法二:利用bytes.decode()进行解码
测试代码如下:
b1 = b'Hello'
s1 = 'Hello'
print(type(b1))
print(type(s1))
# bytes类型转换为str类型
# 方法1 str()函数
s2 = str(b1, encoding="utf-8")
print(s2)
print(type(s2))
# 方法2 bytes.decode()函数
s3 = bytes.decode(b1)
print(s3)
print(type(s3))
测试结果如下:
2. str类型转为bytes类型
初始一个字符串
>>> mystr = 'i am man'
>>> type(mystr)
<class 'str'>
利用str.encode()
按utf-8,str转bytes
>>> mystr_bytes_utf8 = mystr.encode(encoding='utf-8')
>>> mystr_bytes_utf8
b'i am man'
>>> type(mystr_bytes_utf8)
<class 'bytes'>
>>>
同理,按gb2312,str转bytes,改为encoding="gb2312"即可。
decode解码,bytes转string
>>> mystr_string = mystr_bytes_utf8.decode()
>>> mystr_string
'i am man'
decode解码,bytes转string,按照gb2312
>>> mystr_string_gb2312 = mystr_bytes_utf8.decode('gb2312')
>>> mystr_string_gb2312
'i am man'
>>> type(mystr_string_gb2312)
<class 'str'>