Python学习笔记(四)bytes格式和str格式的相互转换
在写Python代码的时候,看到了这个报错。
TypeError: a bytes-like object is required, not 'str'
看了一眼,意思是我输入的变量格式错误了,应该是bytes格式,我输入了一个str格式的变量。因此,我就学习了一下bytes和str格式之间的相互转换。
bytes和str两种格式
首先,str就是最常见的字符串,是字符数据。而bytes是字节数据。我理解的是,str就是给人看的文字,中文汉字,英文单词,都是字符串。而bytes则是转换成二进制的比特流,电脑更容易处理。
bytes和str的相互转换
bytes和str的直接声明
在Python中,bytes和str的格式看起来差不多。
我用今天的日期作为例子。
# str和bytes格式的直接创建
date = '20200920'
date_b = b'MjAyMDA5MjA='
type(date)
type(data_b)
输出结果为
<class 'str'>
<class 'bytes'>
可以看出,对于str格式,直接使用 ‘’ 就可以创建。对于bytes格式,就是在引号前面添加一个b。
从str到bytes(编码)和从bytes到str(解码)
从str到bytes的过程,我们称之为编码(encode)。是从人能阅读的字符数据,转换到机器阅读的字节数据。反之,称之为解码(decode)
使用str() 和bytes() 进行编码和解码
>>> date = '20200920'
>>> date_b = b'MjAyMDA5MjA='
>>> # 编码
>>> b = bytes(date, encoding='utf-8')
>>> print(b)
b'20200920'
>>> type(b)
<class 'bytes'>
>>> # 解码
>>> a = str(date_b, encoding='utf-8')
>>> print(a)
MjAyMDA5MjA=
>>> type(a)
<class 'str'>
可以看出,编码和解码不改变 ‘’ 中的内容,只改变变量的格式。
另一种编解码方式:encode()和decode()
>>> date = '20200920'
>>> date_b = b'MjAyMDA5MjA='
>>> # 编码
>>> b = date.encode(encoding='utf-8')
>>> print(b)
b'20200920'
>>> type(b)
<class 'bytes'>
>>> # 解码
>>> a = date_b.decode(encoding='utf-8')
>>> print(a)
MjAyMDA5MjA=
>>> type(a)
<class 'str'>
结果和使用str()和bytes()函数一致。