Python 二进制文件转浮点

最新推荐文章于 2023-07-21 11:39:52 发布

林头头03

最新推荐文章于 2023-07-21 11:39:52 发布

阅读量4.8k

点赞数 1

本文链接：https://blog.csdn.net/qq_29373285/article/details/82766437

版权

首先导入所需的包：import struct

struct有以下几个主要的函数：

#  按照给定的格式(fmt)，把数据封装成字符串(实际上是类似于c结构体的字节流)
pack(fmt, v1, v2, ...)
 
# 按照给定的格式(fmt)解析字节流string，返回解析出来的tuple
unpack(fmt, string)      
 
# 计算给定的格式(fmt)占用多少字节的内存
calcsize(fmt)

例如：我需要读取一个名为filename，存放着形状为[100,1025]的浮点数的文件。可以采用以下办法

import numpy as np
import struct

# 加载测试数据
f = open('filename','rb')
# 102500为文档中包含的数字个数，而一个浮点数占4个字节
data_raw = struct.unpack('f'*102500,f.read(4*102500))
f.close()
verify_data = np.asarray(verify_data_raw).reshape(-1,1025)

同理如果想转把二进制转成double型：

import numpy as np
import struct

f = open('data8.dat','rb')
d_str = f.read()
f.close()
d_len = len(d_str)
d_len2 = d_len//8
    
#有时还需考虑字节顺序，如为big-endian，则以上语句改为  data = struct.unpack('>'+str(d_len/4)+'f',d_str)
data = struct.unpack(d_len2*'d',d_str)

注意：fmt前的数字必须为int型，即int*'d' 否则会报‘can't multiply sequence by non-int of type 'float'’ 的错误

具体函数细节请查询 struct官方文档

下面提供了了fmt表示方法

FORMAT	PYTHON TYPE	STANDARD SIZE
x	no value
c	string of length 1	1
b	integer	1
B	integer	1
?	bool	1
h	integer	2
H	integer	2
i	integer	4
I	integer	4
l	integer	4
L	integer	4
q	integer	8
Q	integer	8
f	float	4
d	float	8
s	string
p	string
P	integer

为了同c中的结构体交换数据，还要考虑有的c或c++编译器使用了字节对齐，通常是以4个字节为单位的32位系统，故而struct根据本地机器字节顺序转换.可以用格式中的第一个字符来改变对齐方式.定义如下：

CHARACTER	BYTE ORDER	SIZE	ALIGNMENT
@	native	native	native
=	native	standard	none
<	little-endian	standard	none
>	big-endian	standard	none
!	network (= big-endian)	standard	none