python二进制文件解析_python二进制文件的转译详解

最新推荐文章于 2023-12-04 09:11:38 发布

weixin_39882271

最新推荐文章于 2023-12-04 09:11:38 发布

阅读量540

点赞数

文章标签： python二进制文件解析

首先导入所需的包：import struct

struct有以下几个主要的函数：

# 按照给定的格式(fmt)，把数据封装成字符串(实际上是类似于c结构体的字节流)

pack(fmt, v1, v2, ...)

# 按照给定的格式(fmt)解析字节流string，返回解析出来的tuple

unpack(fmt, string)

# 计算给定的格式(fmt)占用多少字节的内存

calcsize(fmt)

例如：我需要读取一个名为filename，存放着形状为[100,1025]的浮点数的文件。可以采用以下办法

import numpy as np

import struct

# 加载测试数据

f = open('filename','rb')

# 102500为文档中包含的数字个数，而一个浮点数占4个字节

data_raw = struct.unpack('f'*102500,f.read(4*102500))

f.close()

verify_data = np.asarray(verify_data_raw).reshape(-1,1025)

同理如果想转把二进制转成double型：

import numpy as np

import struct

f = open('data8.dat','rb')

d_str = f.read()

f.close()

d_len = len(d_str)

d_len2 = d_len//8

#有时还需考虑字节顺序，如为big-endian，则以上语句改为 data = struct.unpack('>'+str(d_len/4)+'f',d_str)

data = struct.unpack(d_len2*'d',d_str)

注意：fmt前的数字必须为int型，即int*'d' 否则会报‘can't multiply sequence by non-int of type 'float'' 的错误

具体函数细节请查询 struct官方文档

下面提供了了fmt表示方法

FORMAT

PYTHON TYPE

STANDARD SIZE

x

no value

c

string of length 1

1

b

integer

1

B

integer

1

?

bool

1

h

integer

2

H

integer

2

i

integer

4

I

integer

4

l

integer

4

L

integer

4

q

integer

8

Q

integer

8

f

float

4

d

float

8

s

string

p

string

P

integer

为了同c中的结构体交换数据，还要考虑有的c或c++编译器使用了字节对齐，通常是以4个字节为单位的32位系统，故而struct根据本地机器字节顺序转换.可以用格式中的第一个字符来改变对齐方式.定义如下：

CHARACTER

BYTE ORDER

SIZE

ALIGNMENT

@

native

native

native

=

native

standard

none

<

little-endian

standard

none

>

big-endian

standard

none

!

network (= big-endian)

standard

none

< ： Little-Endian就是低位字节排放在内存的低地址端(栈顶)，高位字节排放在内存的高地址端(栈底)

>：Big-Endian就是高位字节排放在内存的低地址端，低位字节排放在内存的高地址端。

！: 网络字节序：TCP/IP各层协议将字节序定义为Big-Endian，因此TCP/IP协议中使用的字节序通常称之为网络字节序。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持脚本之家。

weixin_39882271

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python二进制文件解析_python二进制文件的转译详解

首先导入所需的包：import structstruct有以下几个主要的函数：# 按照给定的格式(fmt)，把数据封装成字符串(实际上是类似于c结构体的字节流)pack(fmt, v1, v2, ...)# 按照给定的格式(fmt)解析字节流string，返回解析出来的tupleunpack(fmt, string)# 计算给定的格式(fmt)占用多少字节的内存calcsize(fmt)例如：我需...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。