Python内置数据结构之 bytes、bytearray

Python内置数据结构


bytes、bytearray

  • Python3引入两个新类型

  • bytes
    不可变字节序列

  • bytearray
    字节数组
    可变

  • 字符串与bytes
    字符串是字符组成的有序序列,字符可以使用编码来理解
    bytes是字节组成的有序的不可变序列
    bytearray是字节组成的有序的可变序列

  • 编码与解码
    字符串按照不同的字符集编码encode返回字节序列bytes
    encode(encoding=‘utf-8’, errors=‘strict’) -> bytes

  • 字节序列按照不同的字符集解码decode返回字符串
    bytes.decode(encoding=“utf-8”, errors=“strict”) -> str
    bytearray.decode(encoding=“utf-8”, errors=“strict”) -> str

ASCII

  • ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套单字节编码系统
  • 熟记

\t、\r、\n
0~9
A-Z
a-z

在这里插入图片描述

bytes定义

  • 定义
    bytes() 空bytes
    bytes(int) 指定字节的bytes,被0填充
    bytes(iterable_of_ints) -> bytes [0,255]的int组成的可迭代对象
    bytes(string, encoding[, errors]) -> bytes 等价于string.encode()
    bytes(bytes_or_buffer) -> immutable copy of bytes_or_buffer 从一个字节序列或者buffer复制出一个新的不可变的bytes对象

  • 使用b前缀定 只允许基本ASCII使用字符形式b’abc9’
    使用16进制表示b"\x41\x61"

bytes操作

  • 和str类型类似,都是不可变类型,所以方法很多都一样。只不过bytes的方法,输入是bytes,输出是bytes
    b’abcdef’.replace(b’f’,b’k’)
    b’abc’.find(b’b’)

  • 类方法 bytes.fromhex(string)
    string必须是2个字符的16进制的形式,‘6162 6a 6b’,空格将被忽略
    bytes.fromhex(‘6162 09 6a 6b00’)

  • hex()
    返回16进制表示的字符串
    ‘abc’.encode().hex()

  • 索引
    b’abcdef’[2] 返回该字节对应的数,int类型

bytearray定义

  • 定义
    bytearray() 空bytearray
    bytearray(int) 指定字节的bytearray,被0填充
    bytearray(iterable_of_ints) -> bytearray [0,255]的int组成的可迭代对象
    bytearray(string, encoding[, errors]) -> bytearray 近似string.encode(),不过返回可变对象
    bytearray(bytes_or_buffer) 从一个字节序列或者buffer复制出一个新的可变的bytearray对象

  • 注意,b前缀定义的类型是bytes类

  • 和bytes类型的方法相同
    bytearray(b’abcdef’).replace(b’f’,b’k’)
    bytearray(b’abc’).find(b’b’)

  • 类方法 bytearray.fromhex(string)
    string必须是2个字符的16进制的形式,‘6162 6a 6b’,空格将被忽略
    bytearray.fromhex(‘6162 09 6a 6b00’)

  • hex()
    返回16进制表示的字符串
    bytearray(‘abc’.encode()).hex()

  • 索引
    bytearray(b’abcdef’)[2] 返回该字节对应的数,int类型

  • append(int) 尾部追加一个元素

  • insert(index, int) 在指定索引位置插入元素

  • extend(iterable_of_ints) 将一个可迭代的整数集合追加到当前bytearray

  • pop(index=-1) 从指定索引上移除元素,默认从尾部移除

  • remove(value) 找到第一个value移除,找不到抛ValueError异常

  • 注意:上述方法若需要使用int类型,值在[0, 255]

  • clear() 清空bytearray

  • reverse() 翻转bytearray,就地修

字节序

  • 大端模式,big-endian;小端模式,little-endian
  • Intel X86 CPU使用小端模式
  • 网络传输更多使用大端模式
  • Windows、Linux使用小端模式
  • Mac OS使用大端模式
  • Java虚拟机是大端模式
    在这里插入图片描述
    C2认为是尾巴
    尾巴放在低地址端,就是小端模式
    LSB:Least Significant Bit,最低有效位
    尾巴放在大地址端,就是大端模式
    MSB:Most Significant Bit,最高有效位

int和bytes

  • int.from_bytes(bytes, byteorder)
    将一个字节数组表示成整数

例:i = int.from_bytes(b’abc’, ‘big’)
       print(i, hex(i)) # 6382179 0x616263
       print(i.to_bytes(3, ‘big’)) # b’abc’

  • int.to_bytes(length, byteorder)
    byteorder字节序
    将一个整数表达成一个指定长度的字节数

例:b1 = bytearray()
       b1.append(97)
       b1.extend(range(98, 100))

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值