数据恢复/电子取证 非常有用的python库——Construct

原创 2012年02月01日 15:07:18

和硬盘打交道,不免会用到字节、大\小端对齐、结构等。C语言定义了很多类型,我们定义一个结构,配合mem***函数、大小端转换宏等几乎可以应付了。Python就没那么好用了,因为它本身也不是为这种低级操作而设计的。处理这种二进制数据,貌似只有struct库能沾上一点边,它用起来像printf,数据一多就会把你搞晕的,它还有几个致命缺点:1. 不支持小于1个字节的;2. 数据格式固定。总的来说,它的扩展性和易用性是很差的。

Construct一改模仿C语言struct的“趋势”,结构体不再是对数据的定义而是描述。这一颠覆性的思想可以说把数据流unpack推向到一个新台阶。我们不再受限于语言本身所定义的类型,而是像正则表达式那样根据数据格式来描述结构。

这种思想也不是Construct首先提出的,一些网络数据包处理程序很早也在使用(Construct最早也是用于处理TCP/IP数据包的)。我们可以看看该库所带的一个处理mbr解析的示例

from construct import *


mbr = Struct("mbr",
    HexDumpAdapter(Bytes("bootloader_code", 446)),
    Array(4,
        Struct("partitions",
            Enum(Byte("state"),
                INACTIVE = 0x00,
                ACTIVE = 0x80,
            ),
            BitStruct("beginning",
                Octet("head"),
                Bits("sect", 6),
                Bits("cyl", 10),
            ),
            Enum(UBInt8("type"),
                Nothing = 0x00,
                FAT12 = 0x01,
                XENIX_ROOT = 0x02,
                XENIX_USR = 0x03,
                FAT16_old = 0x04,
                Extended_DOS = 0x05,
                FAT16 = 0x06,
                FAT32 = 0x0b,
                FAT32_LBA = 0x0c,
                NTFS = 0x07,
                LINUX_SWAP = 0x82,
                LINUX_NATIVE = 0x83,
                _default_ = Pass,
            ),
            BitStruct("ending",
                Octet("head"),
                Bits("sect", 6),
                Bits("cyl", 10),
            ),
            UBInt32("sector_offset"), # offset from MBR in sectors
            UBInt32("size"), # in sectors
        )
    ),
    Const(Bytes("signature", 2), "\x55\xAA"),
)



if __name__ == "__main__":
    cap1 = (
    "33C08ED0BC007CFB5007501FFCBE1B7CBF1B065057B9E501F3A4CBBDBE07B104386E00"
    "7C09751383C510E2F4CD188BF583C610497419382C74F6A0B507B4078BF0AC3C0074FC"
    "BB0700B40ECD10EBF2884E10E84600732AFE4610807E040B740B807E040C7405A0B607"
    "75D2804602068346080683560A00E821007305A0B607EBBC813EFE7D55AA740B807E10"
    "0074C8A0B707EBA98BFC1E578BF5CBBF05008A5600B408CD1372238AC1243F988ADE8A"
    "FC43F7E38BD186D6B106D2EE42F7E239560A77237205394608731CB80102BB007C8B4E"
    "028B5600CD1373514F744E32E48A5600CD13EBE48A560060BBAA55B441CD13723681FB"
    "55AA7530F6C101742B61606A006A00FF760AFF76086A0068007C6A016A10B4428BF4CD"
    "136161730E4F740B32E48A5600CD13EBD661F9C3496E76616C69642070617274697469"
    "6F6E207461626C65004572726F72206C6F6164696E67206F7065726174696E67207379"
    "7374656D004D697373696E67206F7065726174696E672073797374656D000000000000"
    "0000000000000000000000000000000000000000000000000000000000000000000000"
    "00000000000000000000000000000000002C4463B7BDB7BD00008001010007FEFFFF3F"
    "000000371671020000C1FF0FFEFFFF761671028A8FDF06000000000000000000000000"
    "000000000000000000000000000000000000000055AA"        
    ).decode("hex")
    
    print mbr.parse(cap1)

Construct由众多Adapter构成,你可以为某种特定的数据流形式定义一种。上例中的Enum, BitStruct也算一种。相信在你看完这个例子后应该知道什么是“结构描述”了。

Construct可以从pypi上下载到。它有很完善的文档,初学者建议从这里开始http://construct.wikispaces.com/tutorial

Advanced Python Constructs(译)

高级Python结构 原谅渣翻译,可能仅仅是给我自己看的。本来多年(也就几个月吧)之前将此文投递到OSChina翻译频道结果被以代码太多为由被拒,于是译者只好用自己的渣英语渣水平翻译给自己看了…...
  • zt_706
  • zt_706
  • 2013年09月09日 14:54
  • 705

电子取证工具

电子取证工具 你准备好了吗?在计算机取证过程中,相应的取证工具必不可少,常见的有Tcpdump、Argus、NFR、Tcpwrapper、Sniffers、Honeypot,Tripwires、Net...
  • jiangxinyu
  • jiangxinyu
  • 2007年10月26日 14:02
  • 6584

python的三种取整方式

下面介绍几种常用的取整方法,包括向下取整、四舍五入、向上取整。(1)向下取整向下取整很简单,直接使用int()函数即可,如下代码(Python 2.7.5 IDLE) a ...
  • sinat_32547403
  • sinat_32547403
  • 2016年11月28日 10:57
  • 6315

从零开始:NTFS文件格式的数据恢复的程序设计python语言(1)

本人也是在写论文ING,拿到了这个题目又突然对python语言感兴趣,所以索性一遍学这门语言,一边做毕业设计。 首先,安装python和pycharm。这两个百度一下就可以轻松做到。如果出现错误就多...
  • qq_26692927
  • qq_26692927
  • 2018年01月07日 11:28
  • 15

Python中取整的几种方法小结

前言 对每位程序员来说,在编程过程中数据处理是不可避免的,很多时候都需要根据需求把获取到的数据进行处理,取整则是最基本的数据处理。取整的方式则包括向下取整、四舍五入、向上取整等等。下面就来看看在Py...
  • weixin_37722024
  • weixin_37722024
  • 2017年03月23日 17:48
  • 5542

Python 简单数据备份脚本

手动备份 version 1 #!/usr/bin/python #Filename: backup_v1.py import os import time source = ['/root/s...
  • ordeder
  • ordeder
  • 2014年03月28日 21:52
  • 1325

python 多线程遍历windows盘符下文件操作

队列,多线程,os模块,windows ctypes模块 #!/usr/bin/env python #coding=utf-8 import os,sys,ctypes from threadin...
  • u013636377
  • u013636377
  • 2015年12月24日 10:04
  • 813

数据恢复/电子取证 非常有用的python库——Construct

和硬盘打交道,不免会用到字节、大\小端对齐、结构等。C语言定义了很多类型,我们定义一个结构,配合mem***函数、大小端转换宏等几乎可以应付了。Python就没那么好用了,因为它本身也不是为这种低级操...
  • ani_di
  • ani_di
  • 2012年02月01日 15:07
  • 2672

【浅析刑事诉讼中电子证据取证制度的完善】

来源:《第五届全国司法鉴定工作规范化管理与检验新技术应用研讨会论文集》作者:张春阳、王博、王建雄转自:猎踪(ID:TraceScope)推荐阅读:这些案件不需要费心寻找证据辨认结论的证据属性与适用...
  • xCnhYKoHj3eK
  • xCnhYKoHj3eK
  • 2018年02月02日 00:00
  • 24

国外电子证据及计算机法证技术发展近况

                                                            CF Team   中国计算机取证技术研究组HTCIA高科技犯罪调查协会亚太区分...
  • jiangxinyu
  • jiangxinyu
  • 2007年11月08日 08:23
  • 3411
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:数据恢复/电子取证 非常有用的python库——Construct
举报原因:
原因补充:

(最多只允许输入30个字)