在Python 3中,struct 模块允许我们使用 C 结构体格式化字符串处理二进制数据。
打包数据
data_tuple = (258, 3, 1.5)
format_string = '<hif'
packed_data = struct.pack(format_string, *data_tuple)
print("打包后的二进制数据:", packed_data)
输出:打包后的二进制数据: b’\x02\x01\x03\x00\x00\x00\x00\x00\xc0?’
在 struct 模块的格式化字符串中,字节序标识符可以有以下几种取值:
- < 表示小端字节序(little-endian)。
- > 表示大端字节序(big-endian)。
- ! 表示网络字节序(network byte order),它通常与大端字节序相同。
- 如果不指定字节序,struct 模块默认使用本地字节序,即计算机硬件的字节序。在网络通信中,经常使用大端字节序,因此可以使用 > 或者 ! 指定网络字节序,以确保数据的正确解析。
所以,<hif 中的 < 表示使用小端字节序,h 表示一个16位整数,i 表示一个32位整数,f 表示一个浮点数。
解包数据
逆向操作就是:
unpacked_data = struct.unpack('<hif', packed_data)
short_int_value = unpacked_data[0] # 获取16位整数的值
int_value = unpacked_data[1] # 获取32位整数的值
float_value = unpacked_data[2] # 获取浮点数的值
输出如下:
>>> print(unpacked_data)
(258, 3, 1.5)
struct模块的其他函数
struct 模块主要提供了 pack() 和 unpack() 这两个核心函数,用于处理二进制数据的打包和解包操作。除了这两个函数,struct 模块还提供了一些其他辅助性的函数,用于处理格式化字符串的创建和解析。
- struct.pack(format, v1, v2, …):将给定的数据打包成一个字符串,返回打包后的二进制数据。
- struct.unpack(format, buffer):从二进制数据中解析出数据,返回一个元组。
- struct.calcsize(format):返回给定格式化字符串的字节数。这个函数在你需要预先知道打包后的数据大小时非常有用。
- struct.pack_into(format, buffer, offset, v1, v2, …):将数据打包到一个预先分配好的缓冲区中的指定位置。
- struct.unpack_from(format, buffer, offset=0):从指定位置开始解析二进制数据。
这些函数一起提供了一种方便的方法来处理二进制数据。