2.7 struct:二进制数据结构
struct模块包括一些函数,这些函数可以完成字节串与原生python数据类型(如数字和字符串)之间的转换。
2.7.1 函数与struct类
struct提供了一组处理结构值的模块级函数,另外还有一个struct类。格式指示符将由字符串格式转换为一种编译表示,这与处理正则表达式的方式类似。这个转换会耗费一些资源,所以创建一个struct实例并在这个实例上调用方法时(不是使用模块级函数)值完成一次转换,这会更高效。下面的例子使用了struct类。
2.7.2 打包和解包
struct支持使用格式指示符将数据打包(packing)为字符串,另外支持从字符串解包(unpacking)数据,格式指示符由表示数据类型的字符和可选的数量及字节序(endianness)指示符构成。要全面了解目前支持的格式指示符,请参考标准文档。
在下面的例子中,指示符要求有一个整型或长整型值、一两个字节字符串以及一个浮点数。格式指示符中包含的空格用来分隔类型指示符,并且在编译格式时会被忽略。
import struct
import binascii
values = (1, 'ab'.encode('utf-8'), 2.7)
s = struct.Struct('I 2s f')
packed_data = s.pack(*values)
print('Original values:',values)
print('Format string :',s.format)
print('Uses :',s.size,'bytes')
print('Packed value :',binascii.hexlify(packed_data))
这个例子将打包的值转换为一个十六进制字节序列,以便用binascii.hexlify()打印,因为有些字符是null。
运行结果:
使用unpack()可以从打包的表示中抽取数据。
import struct
import binascii
packed_data = binascii.unhexlify(b'0100000061620000cdcc2c40')
s = struct.Struct('I 2s f')
unpacked_data = s.unpack(packed_data)
print('Unpacked values:',unpacked_data)
将打包值传入unpack(),基本上会得到相同的值(注意浮点值中的微小差别)。
运行结果: