Python模块学习 ---- struct 数据格式转换

  Python是一门非常简洁的语言,对于数据类型的表示,不像其他语言预定义了许多类型(如:在C#中,光整型就定义了8种),它只定义了六种 基本类型:字符串,整数,浮点数,元组,列表,字典。通过这六种数据类型,我们可以完成大部分工作。但当Python需要通过网络与其他的平台进行交互的 时候,必须考虑到将这些数据类型与其他平台或语言之间的类型进行互相转换问题。打个比方:C++写的客户端发送一个int型(4字节)变量的数据到 Python写的服务器,Python接收到表示这个整数的4个字节数据,怎么解析成Python认识的整数呢? Python的标准模块struct就用来解决这个问题。

  struct模块的内容不多,也不是太难,下面对其中最常用的方法进行介绍:

 struct.pack

  struct.pack用于将Python的值根据格式符,转换为字符串(因为Python中没有字节(Byte)类型,可以把这里的字符串理 解为字节流,或字节数组)。其函数原型为:struct.pack(fmt, v1, v2, ...),参数fmt是格式字符串,关于格式字符串的相关信息在下面 有 所介绍。v1, v2, ...表示要转换的python值。下面的例子将两个整数转换为字符串(字节流):

  1. import  struct  
  2.   
  3. a = 20   
  4. b = 400   
  5.   
  6. str = struct.pack("ii" , a, b)   #转换后的str虽然是字符串类型,但相当于其他语言中的字节流(字节数组),可以在网络上传输   
  7. print   'length:' , len(str)  
  8. print  str  
  9. print  repr(str)  
  10.   
  11. #---- result   
  12. #length: 8   
  13. #    ----这里是乱码   
  14. #'/x14/x00/x00/x00/x90/x01/x00/x00'   

格式符"i"表示转换为int,'ii'表示有两个int变量。进行转换后的结果长度为8个字节(int类型占用4个字节,两个int为8个字 节),可以看到输出的结果是乱码,因为结果是二进制数据,所以显示为乱码。可以使用python的内置函数repr来获取可识别的字符串,其中十六进制的 0x00000014, 0x00001009分别表示20和400。

struct.unpack

  struct.unpack做的工作刚好与 struct.pack相反,用于将字节流转换成python数据类型。它的函数原型为:struct.unpack(fmt, string),该函数返回一个元组 。 下面是一个简单的例子:

  1. str = struct.pack( "ii"20400 )  
  2. a1, a2 = struct.unpack("ii" , str)  
  3. print   'a1:' , a1  
  4. print   'a2:' , a2  
  5.   
  6. #---- result:   
  7. #a1: 20   
  8. #a2: 400   

struct.calcsize

  struct.calcsize用于计算格式字符串所对应 的结果的长度,如:struct.calcsize('ii'),返回8。因为两个int类型所占用的长度是8个字节。

struct.pack_into, struct.unpack_from

   这两个函数在Python手册中有所介绍,但没有给出如何使用的例子。其实它们在实际应用中用的并不多。Google了很久,才找到一个例 子,贴出来共享一下:

  1. import  struct  
  2. from  ctypes  import  create_string_buffer  
  3.   
  4. buf = create_string_buffer(12 )  
  5. print  repr(buf.raw)  
  6.   
  7. struct.pack_into("iii" , buf,  012 , - 1 )  
  8. print  repr(buf.raw)  
  9.   
  10. print  struct.unpack_from( 'iii' , buf,  0 )  
  11.   
  12. #---- result   
  13. #'/x00/x00/x00/x00/x00/x00/x00/x00/x00/x00/x00/x00'   
  14. #'/x01/x00/x00/x00/x02/x00/x00/x00/xff/xff/xff/xff'   
  15. #(1, 2, -1)   

关于格式字符串

  在Python手册中,给出了C语言中常用类型与Python类型对应的格式符:

 

格式符C语言类型Python 类型
x pad byteno value 
c char string of length 1 
b signed char integer 
B unsigned char integer 
? _Bool bool 
h short integer 
H unsigned short integer 
i int integer 
I unsigned int integer or long 
l long integer 
L unsigned long long 
q long long long 
Q unsigned long long long 
f float float 
d double float 
s char[] string 
p char[] string 
P void * long

具体内容请参考Python手册 struct 模块

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值