Python之struct-将字节数据解析为打包的二进制数据

最新推荐文章于 2024-10-08 10:49:07 发布

sophy_sun

最新推荐文章于 2024-10-08 10:49:07 发布

阅读量759

点赞数

分类专栏： Python 学习文章标签： python

原文链接：https://docs.python.org/3/library/struct.html?highlight=struct#struct-alignment

版权

Python 学习专栏收录该内容

21 篇文章 2 订阅

订阅专栏

struct 模块用于将python值和C结构数据之间的转换，C结构由Python bytes对象表示。

一些struct的函数及方法支持缓存参数（buffer argument）.缓存参数能够提供一个可读的或可读写的buffer。而缓存参数参考了实现Buffer Protocol协议的对象。

模块的函数及异常处理

struct.error - 多个场景都会抛出此类异常，蚕食是字符串类型，用来描述哪里出问题了

struct.pack(format, v1, v2, ...)

format, 字符压缩格式，v1， v2，...被压缩的对象； struct.pack(format, v1,v2,...) 将python数据v1，v2, ... 按照指定格式format，压缩成一个字节（bytes）对象。参数与格式的值需要完全匹配。

struct.pack_info(format, buffer, offset, v1, v2,...)

将v1,v2,....的值按照格式字符打包，并将打包的字节对象数据写到一个可写的缓存区，其中offset是缓存区的起始位置，且offset 是一个必传参数

struct.unpack(format, buffer) - 返回的对象是元组类型

假定buffer是通过pack(format) 函数打包的数据，umpack(format, buffer) 根据指定的format 将buffer中的数据拆包。缓存区的数据字节大小必须和format要求的大小一致。

struct.unpack_from(format, /, buffer, offset = 0）

根据format string的格式，将偏移量从offset 开启的缓存内容解压，并返回一个元组对象。注意：从offset开始，缓存区字节的大小至少等于format 格式所表示的字节大小。

struct.iter_unpack(format, buffer) - 该函数返回一个迭代器，该迭代器可以从buffer中读取与format对应的bytes大小相等的内容。

根据format string的格式，迭代的将缓存内容解压，

struct.calcsize(format) - 返回struct的format字符串表示的bytes的大小，

格式字符串 Format Strings

格式字符串用来指定打包和解包数据的布局机制，

字节顺序，大小与对齐机制

默认情况下，C类型由机器的原始格式和顺序表示，并通过跳过一些pad类型来实现合理的对齐。

或者，格式串的第一个字符用来表示字节的顺序，大小和打包数据的对齐方式，如下表：

格式字符串

C结构与Python数据之间的转化应该明确指定数据的类型。当格式串以‘'<’,'>','!', '=' 开头时，表示被打包数据类型的字节的标准大小为依据，当使用原始大小时，打包的数据是平台独立的。（即不容机器上的数据个字节大小是相同的）

如下图： format 列是不同数据类型的格式串，standard size 是该格式代表的字节数的大小

格式字符前面可以有整数数字，表示重复整数次。例如，格式串 ‘4h’ 意思是‘’hhhh‘’。

对于格式字符‘’s’ 来说，前面的整数表示字节的长度，并不表示重复的次数，例如‘10s’表示一个10个字节的字符串，而‘10c’ 表示10个字符。重复次数默认是1.。打包时，字符串可能会被截断（truncate）或用null字节补齐（padding），以保证符合格式串。

字符中间的空格会被忽略掉，但是整数和格式串之间不能有空格。

代码示例：

b = pack('hhl', 1, 2, 3)
print(b)  # 输出二进制：b'\x01\x00\x02\x00\x03\x00\x00\x00'

n = unpack('hhl', b'\x01\x00\x02\x00\x03\x00\x00\x00')
print(n)  # (1, 2, 3)

print(calcsize('hhl'))  # 8个字节

# b'name'
s = pack('4s', b'name')
print(s)

# b'name'
print(pack('4s', 'name'.encode('utf-8')))
print(unpack('4s', b'name'))  # (b'name',)

参考文档：

struct — Interpret bytes as packed binary data — Python 3.10.4 documentationhttps://docs.python.org/3/library/struct.html?highlight=struct#struct-alignment