0 引言
学过了线性列表字符串str""、列表list[]、元组tuple(),今天我们来聊聊另外两个非常重要的数据类型: bytes
、bytearray
。
1.概念
bytes
与bytearray
都是Python3
才引入的两个类型。
bytes
表示字节序列,是一个不可变的数据类型。
bytearray
表示字节数组,是一个可变的数据类型。
定义这两种类型的数据,在内存中开辟的空间都得是连续的。
首先科普一下字母数字等字符在计算机不同编码中所占的字节数:
ASCII码:
一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值0,最大值255。如一个ASCII码就是一个字节。
UTF-8编码:
一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。
Unicode编码:
一个英文等于两个字节,一个中文(含繁体)等于两个字节。
符号:
英文标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“。”占2个字节的大小。
记住常用的几个ASCII 编码:(以16进制为例)
9: 代表制表符 13: 代表回车 10: 代表换行
31: 代表数字1 41: 代表大写字母A 61:代表小写字母a
2、bytes 类型
2、1 bytes 的定义
- bytes:
定义空字节,空字节前面有个 b 来区分。
bytes()
>>>b''
- bytes(int):
直接定义字节的个数,就是创造了几个空字节,但是每个字节里面是空的。
bytes(3)
>>>b'\x00\x00\x00' ## 这是ASCII 0 ,不是阿拉伯数字0,阿拉伯数字0是十进制48,十六进制30.
- bytes(iteratable):
创造可迭代对象的元素个数相等的字节,然后把每个元素填充进去。
注意,必须是整型int 的可迭代对象。
bytes(range(5))
>>>b'\x00\x01\x02\x03\x04'
bytes([1,