使用struct,可以非常方便的处理二进制数据,将常用的int,string等类型的数据转成二进制数据,它有两个重要函数,一个是pack,一个是unpack
先看一张表
struct中支持的格式如下表:
Format | C Type | Python | 字节数 |
---|---|---|---|
x | pad byte | no value | 1 |
c | char | string of length 1 | 1 |
b | signed char | integer | 1 |
B | unsigned char | integer | 1 |
? | _Bool | bool | 1 |
h | short | integer | 2 |
H | unsigned short | integer | 2 |
i | int | integer | 4 |
I | unsigned int | integer or long | 4 |
l | long | integer | 4 |
L | unsigned long | long | 4 |
q | long long | long | 8 |
Q | unsigned long long | long | 8 |
f | float | float | 4 |
d | double | float | 8 |
s | char[] | string | 1 |
p | char[] | string | 1 |
P | void * |
来看一个简单的例子
def demo():
string = struct.pack('ii4s',3,4,'test')
a1,a2,a3 = struct.unpack('ii4s',string)
print a1,a2,a3
这个小小的例子,已经把struct的功能完美的诠释了,对照着上面的图表,我们可以将任何类型的数据转换成二进制数据
但是有两点还是要强调说明一下:
(1) pack 返回的是字符串
(2) unpack返回的是tuple
在实际应用中,我们可以用其将数据保存到二进制文件中,比如个人信息:name,age,address
我们将一个人的个人信息转成二进制数据保存到一个二进制文件中,然后在需要的时候将其取出。现在好好思考一下这个问题,假设有一百条个人信息,每条个人信息都包含name,age,address,我们需要将他们写入到二进制文件中,但是得确保他们一个挨着一个,而且转化后的二进制数据应该是等长的,这样读取的时候才能逐条的读取个人信息。age是年龄,可以用一个int来表示,一个int占4个byte,但name和address都不是定长的,所以需要给他们一个固定的长度,为了简单,我们要求name的长度最大为10byte,address的最大长度为60byte。这样,一个人的个人信息就可以用74byte来表示。pack的第一个参数可以这样来写‘i10s60s’。
这样子写是没有问题的,但是读的时候就有麻烦了,我们为name分配了10个byte,但可能最终只用了6个byte或9个byte来保存name的二进制数据,读取时,使用unpack,得到的是10个byte组成的字符串,这样一来就不清楚name的真实值是什么。
现在,需要一种可以封装变长string的方法。为name分配15个byte,前4个byte用来记录name的长度,剩下的11个byte用来保存name的二进制数据
设计两个函数,一个用来封装变长string,一个用来解封string
#coding=utf-8
'''
Created on 2016-3-7
@author: Administrator
'''
import struct
block = 15
def struct_str(string):
length = len(string)
if length>block-4:
return False,None
length_str = struct.pack('i',length)
new_str = length_str+string
str_pack = struct.pack(str(block)+'s',new_str)
return True,str_pack
def get_struct_str(string):
length = struct.unpack('i',string[0:4])[0]
str_content = struct.unpack('{length}s'.format(length=length),string[4:4+length])[0]
print str_content
if __name__ == '__main__':
state,str = struct_str('非常好')
get_struct_str(str)
注意,传入的string是‘非常好’ ,如果传入u'非常好' 是会报错的,因为pack要求传入字符串