python处理二进制数据

 

有的时候需要用python处理二进制数据,比如,存取文件,socket操作时.这时候,可以使用python的struct模块来完成.可以用struct来处理c语言中的结构体.

struct模块中最重要的三个函数是pack(), unpack(), calcsize()

pack(fmt, v1, v2, ...)    按照给定的格式(fmt),把数据封装成字符串(实际上是类似于c结构体的字节流)

unpack(fmt, string)       按照给定的格式(fmt)解析字节流string,返回解析出来的tuple

calcsize(fmt)             计算给定的格式(fmt)占用多少字节的内存

struct中支持的格式如下表:

> 格式c类型python类型
> xchar无(表示填充字节)
> cchar长度为1的字符串
> bsigned charinteger
> Bunsigned charinteger
> hshortinteger
> Hunsigned shortinteger
> iintinteger
> Iunsigned intlong
> llonginteger
> Lunsigned longlong
> qlong longlong
> Qunsigned long longlong
> ffloatfloat
> ddoublefloat
> schar[]string
> pchar[]string
> Pvoid*integer

注1.q和Q只在机器支持64位操作时有意思
注2.每个格式前可以有一个数字,表示个数
注3.s格式表示一定长度的字符串,4s表示长度为4的字符串,但是p表示的是pascal字符串
注4.P用来转换一个指针,其长度和机器字长相关

默认情况下struct根据本地机器字节顺序转换.不过可以用格式中的第一个字符来改变对齐方式.定义如下:

> 字符字节顺序长度和对齐方式
> @nativenative
> =nativestandard
> <little-endianstandard
> >big-endianstandard
> !network (= big-endian)standard

有了struct,我们就可以很容易操作二进制数据了.

比如有一个结构体:

struct Header

{

    unsigned short id;

    char[4] tag;

    unsigned int version;

    unsigned int count;

}

通过socket.recv接收到了一个上面的结构体数据,存在字符串s中,现在需要把它解析出来,可以使用unpack()函数.

import struct

id, tag, version, count = struct.unpack("!H4s2I", s)

上面的格式字符串中,!表示我们要使用网络字节顺序解析,因为我们的数据是从网络中接收到的,在网络上传送的时候它是网络字节顺序的.后面的H表示一个unsigned short的id,4s表示4字节长的字符串,2I表示有两个unsigned int类型的数据.

就通过一个unpack,现在id, tag, version, count里已经保存好我们的信息了.

同样,也可以很方便的把本地数据再pack成struct格式.

ss = struct.pack("!H4s2I", id, tag, version, count);

pack函数就把id, tag, version, count按照指定的格式转换成了结构体Header,ss现在是一个字符串(实际上是类似于c结构体的字节流),可以通过socket.send(ss)把这个字符串发送出去.

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python 可以很方便地处理二进制数据。以下是一些处理二进制数据的常用函数和方法: 1. 内置函数 `open()`:可以用于打开二进制文件。 ```python f = open('file.bin', 'rb') # 注意使用二进制模式打开文件 ``` 2. 内置函数 `struct.pack()` 和 `struct.unpack()`:可以用于将二进制数据打包和解包。 ```python import struct # 将整数 42 打包成二进制数据 packed = struct.pack('i', 42) print(packed) # 输 b'*\x00\x00\x00' # 将二进制数据解包为整数 unpacked = struct.unpack('i', packed) print(unpacked) # 输 (42,) ``` 3. 内置模块 `array`:可以用于创建和操作数组。 ```python import array # 创建一个包含整数的数组 a = array.array('i', [1, 2, 3]) print(a) # 输 array('i', [1, 2, 3]) # 将数组写入文件 with open('data.bin', 'wb') as f: a.tofile(f) # 从文件中读取数组 with open('data.bin', 'rb') as f: b = array.array('i') b.fromfile(f, 3) print(b) # 输 array('i', [1, 2, 3]) ``` 4. 内置模块 `bytes` 和 `bytearray`:可以用于创建和操作字节序列。 ```python # 创建一个字节序列 b = bytes([0x48, 0x65, 0x6c, 0x6c, 0x6f]) print(b) # 输 b'Hello' # 将字节序列转换为可打印的字符串 s = b.decode('utf-8') print(s) # 输 'Hello' # 创建一个可变字节序列 ba = bytearray(b) ba[0] = 0x68 # 修改第一个字节 print(ba) # 输 bytearray(b'hello') ``` 以上只是一些常见的二进制数据处理函数和方法,Python 还有很多其他的工具和库可以用于处理二进制数据,如 `numpy`、`pandas` 等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值