7 Python struct模块-深入学习

Python struct模块

转载请标明出处(http://blog.csdn.net/lis_12/article/details/52777983).

用处

  1. 按照指定格式将Python数据转换为字符串,该字符串为字节流,如网络传输时,不能传输int,此时先将int转化为字节流,然后再发送;
  2. 按照指定格式将字节流转换为Python指定的数据类型;
  3. 处理二进制数据,如果用struct来处理文件的话,需要用’wb’,’rb’以二进制(字节流)写,读的方式来处理文件;
  4. 处理c语言中的结构体;

struct模块中的函数

函数returnexplain
pack(fmt,v1,v2…)string按照给定的格式(fmt),把数据转换成字符串(字节流),并将该字符串返回.
pack_into(fmt,buffer,offset,v1,v2…)None按照给定的格式(fmt),将数据转换成字符串(字节流),并将字节流写入以offset开始的buffer中.(buffer为可写的缓冲区,可用array模块)
unpack(fmt,v1,v2…..)tuple按照给定的格式(fmt)解析字节流,并返回解析结果
pack_from(fmt,buffer,offset)tuple按照给定的格式(fmt)解析以offset开始的缓冲区,并返回解析结果
calcsize(fmt)size of fmt计算给定的格式(fmt)占用多少字节的内存,注意对齐方式

格式化字符串

当打包或者解包的时,需要按照特定的方式来打包或者解包.该方式就是格式化字符串,它指定了数据类型,除此之外,还有用于控制字节顺序、大小和对齐方式的特殊字符.

对齐方式

为了同c中的结构体交换数据,还要考虑c或c++编译器使用了字节对齐,通常是以4个字节为单位的32位系统,故而struct根据本地机器字节顺序转换.可以用格式中的第一个字符来改变对齐方式.定义如下

CharacterByte orderSizeAlignment
@(默认)本机本机本机,凑够4字节
=本机标准none,按原字节数
<小端标准none,按原字节数
>大端标准none,按原字节数
!network(大端)标准none,按原字节数

如果不懂大小端,见大小端参考网址.

格式符

格式符C语言类型Python类型Standard size
xpad byte(填充字节)no value
ccharstring of length 11
bsigned charinteger1
Bunsigned charinteger1
?_Boolbool1
hshortinteger2
Hunsigned shortinteger2
iintinteger4
I(大写的i)unsigned intinteger4
l(小写的L)longinteger4
Lunsigned longlong4
qlong longlong8
Qunsigned long longlong8
ffloatfloat4
ddoublefloat8
schar[]string
pchar[]string
Pvoid *long

注- -!

  1. _Bool在C99中定义,如果没有这个类型,则将这个类型视为char,一个字节;
  2. q和Q只适用于64位机器;
  3. 每个格式前可以有一个数字,表示这个类型的个数,如s格式表示一定长度的字符串,4s表示长度为4的字符串;4i表示四个int;
  4. P用来转换一个指针,其长度和计算机相关;
  5. f和d的长度和计算机相关;

code,使用示例

#!/usr/bin/python
# -*- coding:utf-8 -*-
'''测试struct模块'''
from struct import *
import array

def fun_calcsize():
    print 'ci:',calcsize('ci')#计算格式占内存大小
    print '@ci:',calcsize('@ci')
    print '=ci:',calcsize('=ci')
    print '>ci:',calcsize('>ci')
    print '<ci:',calcsize('<ci')
    print 'ic:',calcsize('ic')#计算格式占内存大小
    print '@ic:',calcsize('@ic')
    print '=ic:',calcsize('=ic')
    print '>ic:',calcsize('>ic')
    print '<ic:',calcsize('<ic')

def fun_pack(Format,msg = [0x11223344,0x55667788]):
    result = pack(Format,*msg)
    print 'pack'.ljust(10),str(type(result)).ljust(20),
    for i in result:
        print hex(ord(i)), # ord把ASCII码表中的字符转换成对应的整形,hex将数值转化为十六进制
    print

    result = unpack(Format,result)
    print 'unpack'.ljust(10),str(type(result)).ljust(20),
    for i in result:
        print hex(i),
    print 

def fun_pack_into(Format,msg = [0x11223344,0x55667788]):
    r = array.array('c',' '*8)#大小为8的可变缓冲区,writable buffer
    result = pack_into(Format,r,0,*msg)
    print 'pack_into'.ljust(10),str(type(result)).ljust(20),
    for i in r.tostring():
        print hex(ord(i)),
    print

    result = unpack_from(Format,r,0)
    print 'pack_from'.ljust(10),str(type(result)).ljust(20),
    for i in result:
        print hex(i),
    print

def IsBig_Endian():
    '''判断本机为大/小端'''
    a = 0x12345678
    result = pack('i',a)#此时result就是一个string字符串,字符串按字节同a的二进制存储内容相同。
    if hex(ord(result[0])) == '0x78':
        print '本机为小端'
    else:
        print '本机为大端'

def test():
    a = '1234'
    for i in a:
        print '字符%s的二进制:'%i,hex(ord(i))#字符对应ascii码表中对应整数的十六进制

    '''
    不用unpack()返回的数据也是可以使用pack()函数的,只要解包的字符串符合解包格式即可,
    pack()会按照解包格式将字符串在内存中的二进制重新解释(说的感觉不太好...,见下例)
    '''
    print '大端:',hex(unpack('>i',a)[0])#因为pack返回的是元组,即使只有一个元素也是元组的形式
    print '小端:',hex(unpack('<i',a)[0])


if __name__ == "__main__":
    print '判断本机是否为大小端?',
    IsBig_Endian()

    fun_calcsize()

    print '大端:'
    Format = ">ii"
    fun_pack(Format)
    fun_pack_into(Format)

    print '小端:'
    Format = "<ii"
    fun_pack(Format)
    fun_pack_into(Format)

    print 'test'
    test()
    '''
    result:
    判断本机是否为大小端? 本机为小端
    ci: 8
    @ci: 8
    =ci: 5
    >ci: 5
    <ci: 5
    ic: 5
    @ic: 5
    =ic: 5
    >ic: 5
    <ic: 5
    大端:
    pack       <type 'str'>         0x11 0x22 0x33 0x44 0x55 0x66 0x77 0x88
    unpack     <type 'tuple'>       0x11223344 0x55667788
    pack_into  <type 'NoneType'>    0x11 0x22 0x33 0x44 0x55 0x66 0x77 0x88
    pack_from  <type 'tuple'>       0x11223344 0x55667788
    小端:
    pack       <type 'str'>         0x44 0x33 0x22 0x11 0x88 0x77 0x66 0x55
    unpack     <type 'tuple'>       0x11223344 0x55667788
    pack_into  <type 'NoneType'>    0x44 0x33 0x22 0x11 0x88 0x77 0x66 0x55
    pack_from  <type 'tuple'>       0x11223344 0x55667788
    test
    字符1的二进制: 0x31
    字符2的二进制: 0x32
    字符3的二进制: 0x33
    字符4的二进制: 0x34
    大端:0x31323334
    小端:0x34333231
    '''

Python参考手册struct模块链接

英文单词

英文中文
compact紧凑的,简洁的
layout布局
pad bytes填充字节
alignment对齐方式
maintain维持,保持
proper适当的
correspond一致,相应的
platform-independent平台依赖,即机器,操作系统不同,对齐方式,大小端等会有差异
omit忽略
implicit暗含的,隐式的
native本台电脑的
presumably假设
even if即使
specify指定
mechanism原理,机制,手法
represented表现,表示
assumed假定的,默认的
  • 14
    点赞
  • 52
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值