python3 byte 字面值_bytearray() <Python 内置函数>

最新推荐文章于 2024-11-19 19:31:40 发布

weixin_39922147

最新推荐文章于 2024-11-19 19:31:40 发布

阅读量344

点赞数

文章标签： python3 byte 字面值

转载须注明出处：简书@Orca_J35 | GitHub@orca-j35

class bytearray([source[, encoding[, errors]]])

该内置函数本质上是 bytearray 类的构造函数，用于创建一个 bytearray 实例。bytearray 实例是一个由字节(8-bits 无符号)构成的可变序列，并拥有大多数可变序列的常见方法[详见：Mutable Sequence Types]，并且还包含 bytes 类型中的大多数方法[详见： Bytes and Bytearray Operations ]

在 Python 中，我们可以通过 bytes 字面值来创建 bytes 对象，但并没有用于创建 bytearray 字面值的语法，我们只能通过调用构造函数 bytearray() 来创建 bytearray 对象。

初始化 bytearray 实例的方式如下：

没有任何参数时，将创建一个空实例

# bytearray() -> empty bytes array

>>> bytearray()

bytearray(b'')

source 是一个整数时，将创建一个长度为 source 且每个字节均为空的 bytearray 对象

# bytearray(int) -> bytearray

>>> bytearray(5)

bytearray(b'\x00\x00\x00\x00\x00')

source 是一个由自然数构成的可迭代对象，且每个元素的值 x 均满足 0 ≤ x ≤ 255

# bytearray(iterable_of_ints) -> bytearray

>>> bytearray(range(5)) # 最大范围是range(256)

bytearray(b'\x00\x01\x02\x03\x04')

>>> bytearray([1,2,3,4,5])

bytearray(b'\x01\x02\x03\x04\x05')

source 是一个 bytes 对象，将通过缓冲器协议(buffer protocol)复制其中的二进制数据

# bytearray(bytes) -> mutable copy of bytes

>>> bytearray(b'Hi!')

bytearray(b'Hi!')

source 是一个实现了缓冲区(buffer) API 的对象时，则会使用 source 的只读缓冲区来初始化 bytearray 对象。

# bytearray(buffer) -> mutable copy of buffer

source 是一个字符串时，必须给定 encoding 参数。此时，构造函数 bytearray() 会通过 str.encode() 方法将 source 编码(encoding)为字节序列。

encoding 参数用于设置编码方案，会被传递给 str.encode()。在 Standard Encodings 中可查看编码方案列表。

errors 参数用于设置错误处理方案，也会被传递给 str.encode()。如果 errors 为空，str.encode() 会使用默认方案 'strict'——该方案在出现编码错误时会抛出 UnicodeError。errors 可以是 'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' 或任何已通过 codecs.register_error() 注册的名称。

Tips: 在 Python 文档中，"编码(encoding)"是指将 Unicode 字符串转换为字节序列的规则，也就是说"编码"包含了从"抽象字符序列"到"字节序列"的全部过程。

# bytearray(string, encoding[, errors]) -> bytearray

>>> bytearray('abcd','utf-8')

bytearray(b'abcd')

>>> bytearray('鲸','utf-8')

bytearray(b'\xe9\xb2\xb8')

>>> bytearray('鲸','ascii')

Traceback (most recent call last):

File "", line 1, in

bytearray('鲸','ascii')

UnicodeEncodeError: 'ascii' codec can't encode character '\u9cb8' in position 0: ordinal not in range(128)

>>> bytearray('鲸','ascii','ignore')

bytearray(b'')

1. 深入理解 bytearray 对象

在 C 语言中创建字节数组的语法如下：

byte bytes_array[] = {0x02, 0x03, 0x0A, 0x41}

Python 中的 bytearray 对象与 C 语言中的字节数组类似，每个索引位置都对应一个整数 x (且 0≤x≤255)。不同之处在于 bytearray 对象会以转义序列或 ASCII 字符显示相应数值(如，将十进制整数 65 显示为字母 A)，但是 bytearray 对象的每个索引位置仍然是一个数值，而非一个字符。bytearray 对象是一个实实在在的字节序列，每个索引位置对应一个字节(byte)而不是一个字符(char)。

注意：不能将 bytearray 完全等同于 C 的字符数组，因为 bytearray 远比字符数组强大。

下面创建一个与上面的 C 语言字节数组拥有相同内容的 bytearray 对象：

>>> a_obj = bytearray((0x02, 0x03, 0x0A, 0x41))

>>> a_obj

bytearray(b'\x02\x03\nA') # 以转义序列或 ASCII 编码显示相应数值

>>> [ x for x in a_obj]

[2, 3, 10, 65] # 每个索引位置始终对应一个数值，而非一个字符

1.1 如何显示数值

如果某个索引位置的数值对应 ASCII 编码中的可见字符，那么该索引位便会显示该字符：

>>> bytearray((0x41, 0x42))

bytearray(b'AB')

如果某个索引位置的数值对应 ASCII 编码中的不可见字符，但该字符拥有"独立转义序列"，那么该索引位置会显示该"独立转义序列"：