【Python】Struct 库之 pack 和 unpack 详解

本文介绍了Python的struct模块,包括pack、unpack和calcsize函数的用法,以及FormatStrings的概念,如字节顺序、大小和对齐方式。通过示例展示了如何按照特定格式打包和解包数据,强调了字节顺序(大端和小端)在处理数据中的重要性,并提供了实际操作的例子。
摘要由CSDN通过智能技术生成

1. 官网解析

首先是官网对于 packunpackcalcsize 以及 Format Strings 的描述

1.1 pack、unpack、calcsize

在这里插入图片描述
struct.pack 返回一个 bytes对象,其中包含根据格式字符串 format 打包的值 v1, v2,…
参数必须与格式所要求的值完全匹配
在这里插入图片描述
struct.unpack 根据格式字符串 format 从缓冲区 buffer (假设由pack(format,…)打包)中解包。返回一个元组,即使它只包含一个元素。缓冲区的字节大小必须与格式所需的大小匹配,如 calcsize() 所反映的那样。
在这里插入图片描述
struct.calcsize 返回与格式字符串 format 对应的结构体(以及由 pack(format,…)生成的 bytes 对象)的大小。

1.2 Format Strings

这一段在官方的描述中很详细,同时也很长,这里我只放几个重要的地方,剩下的可以自行去官网查阅

在这里插入图片描述
格式字符串描述打包和拆包数据时的数据布局。它们由格式字符组成,格式字符指定打包/解包的数据类型。此外,特殊字符控制字节顺序、大小和对齐方式。每个格式字符串由一个可选的前缀字符(描述数据的总体属性)和一个或多个格式字符(描述实际数据值和填充)组成。

1.2.1 字节顺序、大小和对齐方式

在这里插入图片描述
默认情况下,C 语言的类型以机器的本机格式和字节顺序表示,并在必要时通过填充字节来正确对齐(根据 C 语言编译器使用的规则)。选择这种行为是为了使打包结构体的字节与相应的 C 语言的结构体的内存布局完全对应。是使用本机字节排序和填充还是标准格式取决于应用程序。格式字符串的第一个字符可以用来指示字节顺序、大小和打包数据的对齐方式,如下表所示:
在这里插入图片描述

1.2.2 格式字符

在这里插入图片描述
格式字符有以下含义:给定 C 和 Python 值的类型,它们之间的转换应该是显而易见的。Standard size 列是指使用Standard size时,以字节为单位的打包值的大小;也就是说,当格式字符串以 <>!= 开头的时候(详情见上面一个表格的 Size 列)。当使用 native size 时,打包值的大小取决于平台。
在这里插入图片描述

2. pack 解析

pack会把给定的数据按照 format string 的方式去打包我们来看看例子

例子 1

from struct import *
print(pack(">bhl", 1, 2, 3))

这里 format string>bhl,其中 > 代表采用大端(高位字节在前)的方式打包, bhl 分别代表采用 signed charshortlong(对于 C 语言)的数据类型来分别打包 123,他们分别占用 1 字节、2 字节和 4 字节,下图是运行的结果。b 开头表示是字节类型,输出的结果和我们分析的结果一致
在这里插入图片描述

例子 2

from struct import *
print(pack("<2hl", 1, 2, 3))

这里 format string<2hl,其中 < 代表采用小端(低位字节在前)的方式打包, 2h 代表前面 2 个数据采用 signed short 类型、进一步的,我们可以使用 x+格式字符 来表示,后续 x 个字符都用此格式字符来打包
下图是运行的结果:b 开头表示是字节类型,输出的结果和我们分析的结果一致。
在这里插入图片描述

例子 3

注意下面代码的运行结果

from struct import *
print(pack("@3c", b'1', b'2', b'3'))
print(pack("@1s", b'123'))
print(pack("@2s", b'123'))
print(pack("@3s", b'123'))

在这里插入图片描述
这一段代码主要是 format string 的不同导致了打包的结果和入参不同,其中 c 是以 char 类型去打包,3c 是代表后续的 3 个参数全部按照 char 去打包,而 s 是以 char[] 类型去打包,而 s 前面的数字则是代表打包多少位

3. unpack 解析

unpack 可以理解为是 pack 的逆向,直接看例子

例子1

from struct import *
print(unpack(">bhl",pack(">bhl", 1, 2, 3)))

将上面第一个例子的输出作为unpack的参数输入,然后按照和打包一样的 format string 去进行解包我们可以得到如下的结果,与我们的输入是一致的。
在这里插入图片描述
当然,在很多场景下并不是像这样自己打包数据然后再自己解包,而是需要按照一定的协议去解来自其他地方的字节流,于是可以这样写,在 data 中换成需要解包的数据,然后根据包的协议(字节顺序、大小和对齐方式)来编写解包的 format string

from struct import *
data = b'\x01\x00\x02\x00\x00\x00\x03'
print(unpack('>bhl', data))
structPython中用于处理二进制数据的模块。它提供了pack和unpack函数来执行二进制数据的打包和解包操作。 pack函数的作用是将Python对象按照指定的格式转换为二进制字符串。它接受两个参数:格式字符串和要打包的数据。格式字符串指定了要打包的数据的类型和顺序,可以使用特定的格式字符来表示不同类型的数据,如整数、浮点数、字符串等。打包后的二进制字符串可以用于存储或传输。例如,使用"i"表示整数类型,使用"f"表示单精度浮点数类型。 unpack函数的作用是将二进制字符串解析为Python对象。它接受两个参数:格式字符串和要解包的二进制字符串。根据格式字符串的指定,unpack函数将二进制数据解析为相应的Python对象,并返回一个元组,其中包含解析后的数据。例如,使用"i"表示整数类型,使用"f"表示单精度浮点数类型。 下面是一个示例: ```python import struct # 打包 data = struct.pack("if", 10, 3.14) print(data) # b'\n\x00\x00\x00\x1f\x85\xebQ' # 解包 unpacked_data = struct.unpack("if", data) print(unpacked_data) # (10, 3.140000104904175) ``` 在上面的示例中,我们使用格式字符串"if"对整数和浮点数进行打包和解包操作。打包后的二进制字符串为`b'\n\x00\x00\x00\x1f\x85\xebQ'`,解包后得到的元组为`(10, 3.140000104904175)`。 需要注意的是,格式字符串中的格式字符和要打包/解包的数据类型要匹配,否则可能会导致数据错误或异常。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天地神仙

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值