处理脱机dump文件(上)

      如题所示,今天要讲解处理脱机dump文件(Handling offline files)。dump文件大家一定不会太陌生,其实就是进程的内存镜像。dump很大程度上是一个计算机术语,你应该会在跟备份有关的领域里听到这个词。而对于WinPcap的dump文件来说,其实就是将捕获到的所有网络数据包的信息存储到文件当中。事实上这是相当有意义的一件事情,用过捕包软件的同志,比如WireShark,将捕获到的信息保存至文件,还可以将文件中的信息载入到分析软件中,这样可以方便多次地查看和分析。WinPcap正是提供了相关的API来让开发者方便做这些事情,导出的格式也是和libpcap保持一致的,保持高度的移植性。

      咱们先来看看一个小程序,它实现的功能就是捕获用户指定设备的网络数据包并保存至文件。

#define HAVE_REMOTE
#include <pcap.h>

/* 回调函数原型 */
void packet_handler(u_char *param, const struct pcap_pkthdr *header, const u_char *pkt_data);

int main(int argc, char **argv)
{
    pcap_if_t *alldevs;
    pcap_if_t *d;
    int inum;
    int i=0;
    pcap_t *adhandle;
    char errbuf[PCAP_ERRBUF_SIZE];
    pcap_dumper_t *dumpfile;



    /* 检查程序输入参数 */
    if(argc != 2)
    {
        printf("usage: %s filename", argv[0]);
        return -1;
    }

    /* 获取本机设备列表 */
    if (pcap_findalldevs_ex(PCAP_SRC_IF_STRING, NULL, &alldevs, errbuf) == -1)
    {
        fprintf(stderr,"Error in pcap_findalldevs: %s\n", errbuf);
        exit(1);
    }

    /* 打印列表 */
    for(d=alldevs; d; d=d->next)
    {
        printf("%d. %s", ++i, d->name);
        if (d->description)
            printf(" (%s)\n", d->description);
        else
            printf(" (No description available)\n");
    }

    if(i==0)
    {
        printf("\nNo interfaces found! Make sure WinPcap is installed.\n");
        return -1;
    }

    printf("Enter the interface number (1-%d):",i);
    scanf("%d", &inum);

    if(inum < 1 || inum > i)
    {
        printf("\nInterface number out of range.\n");
        /* 释放列表 */
        pcap_freealldevs(alldevs);
        return -1;
    }

    /* 跳转到选中的适配器 */
    for(d=alldevs, i=0; i< inum-1 ; d=d->next, i++);


    /* 打开适配器 */
    if ( (adhandle= pcap_open(d->name,          // 设备名
                              65536,            // 要捕捉的数据包的部分
                              // 65535保证能捕获到不同数据链路层上的每个数据包的全部内容
                              PCAP_OPENFLAG_PROMISCUOUS,    // 混杂模式
                              1000,             // 读取超时时间
                              NULL,             // 远程机器验证
                              errbuf            // 错误缓冲池
                             ) ) == NULL)
    {
        fprintf(stderr,"\nUnable to open the adapter. %s is not supported by WinPcap\n", d->name);
        /* 释放设备列表 */
        pcap_freealldevs(alldevs);
        return -1;
    }

    /* 打开堆文件 */
    dumpfile = pcap_dump_open(adhandle, argv[1]);

    if(dumpfile==NULL)
    {
        fprintf(stderr,"\nError opening output file\n");
        return -1;
    }

    printf("\nlistening on %s... Press Ctrl+C to stop...\n", d->description);

    /* 释放设备列表 */
    pcap_freealldevs(alldevs);

    /* 开始捕获 */
    pcap_loop(adhandle, 0, packet_handler, (unsigned char *)dumpfile);

    return 0;
}

/* 回调函数,用来处理数据包 */
void packet_handler(u_char *dumpfile, const struct pcap_pkthdr *header, const u_char *pkt_data)
{
    /* 保存数据包到堆文件 */
    pcap_dump(dumpfile, header, pkt_data);
}

  这个程序看起来不是那么地吃力,如果看过我之前写过的博客的话。dumpfile它是一个pcap_dumper结构体指针,我们无从看到pcap_dumper结构体的定义,它也是WinPcap内核的一部分。文档上介绍它是一个libpcap文件描述符。调用pcap_dump_open()函数只需要给两个参数,一个是接口指针,另一个是文件名,返回的是文件指针。通过调用pcap_dump_open()这个函数我们就可以将文件和接口关联起来。pcap_loop()回调函数里只有一行代码,pcap_dump(),它的作用是将网络数据写入文件。这里我们需要注意一下pcap_loop()函数的给定,大致可以知道pcap_loop()最后一个参数是回调函数的一个用户参数。

      看完了一个简单的写文件操作,下面咱们再看看如何从dump文件中将数据读取出来,仍然是给出一个实例。

#define HAVE_REMOTE
#include <stdio.h>
#include <pcap.h>

#define LINE_LEN 16

void dispatcher_handler(u_char *, const struct pcap_pkthdr *, const u_char *);

int main(int argc, char **argv)
{
    pcap_t *fp;
    char errbuf[PCAP_ERRBUF_SIZE];
    char source[PCAP_BUF_SIZE];

    if(argc != 2)
    {

        printf("usage: %s filename", argv[0]);
        return -1;

    }

    /* 根据新WinPcap语法创建一个源字符串 */
    if ( pcap_createsrcstr( source,         // 源字符串
                            PCAP_SRC_FILE,  // 我们要打开的文件
                            NULL,           // 远程主机
                            NULL,           // 远程主机端口
                            argv[1],        // 我们要打开的文件名
                            errbuf          // 错误缓冲区
                          ) != 0)
    {
        fprintf(stderr,"\nError creating a source string\n");
        return -1;
    }

    /* 打开捕获文件 */
    if ( (fp= pcap_open(source,         // 设备名
                        65536,          // 要捕捉的数据包的部分
                        // 65535保证能捕获到不同数据链路层上的每个数据包的全部内容
                        PCAP_OPENFLAG_PROMISCUOUS,     // 混杂模式
                        1000,              // 读取超时时间
                        NULL,              // 远程机器验证
                        errbuf         // 错误缓冲池
                       ) ) == NULL)
    {
        fprintf(stderr,"\nUnable to open the file %s.\n", source);
        return -1;
    }

    // 读取并解析数据包,直到EOF为真
    pcap_loop(fp, 0, dispatcher_handler, NULL);

    return 0;
}



void dispatcher_handler(u_char *temp1,
                        const struct pcap_pkthdr *header, const u_char *pkt_data)
{
    u_int i=0;

    /* 打印pkt时间戳和pkt长度 */
    printf("%ld:%ld (%u)\n", header->ts.tv_sec, header->ts.tv_usec, header->len);

    /* 打印数据包 */
    for (i=1; (i < header->caplen + 1 ) ; i++)
    {
        printf("%.2x ", pkt_data[i-1]);
        if ( (i % LINE_LEN) == 0) printf("\n");
    }

    printf("\n\n");

}

  上面这个例子中引用了几个新的函数,我一一来介绍。pcap_createsrcstr(),根据函数名称我们可以猜测到它是用来创建一个源字符串的,那么这个源字符串是什么东西呢?事实上它是WinPcap定义的一种格式,例如使用"rpcap://"表示打开一个适配器,前面我们也在pcap_findalldevs_ex()中用到过;又如“file://”它是用来打开一个文件。根据例子中的注释我们可以清楚它的几个参数的意义,这里就不再赘述了。另外我们看到pcap_open()的第一个参数不再是我们之前给定的设备名称,而是我们刚才调用pcap_createsrcstr()函数所获得的源字符串。而pcap_loop()回调函数的作用就是将文件中的内容打印出来。

转载于:https://www.cnblogs.com/blacksword/archive/2012/03/13/2393868.html

Python是一种广泛用于数据处理和分析的编程语言。在处理数据dump文件时,Python提供了一套丰富的库来读取、解析和操作数据。数据dump文件通常包含了特定格式的数据,例如JSON、CSV或者数据库的dump文件等。 下面是一个简单的例子,介绍如何使用Python来处理常见的数据格式: 1. 处理JSON数据: Python内置的`json`模块可以用来解析JSON格式的文件。JSON是JavaScript Object Notation的缩写,是一种轻量级的数据交换格式,易于人阅读和编写,同时也易于机器解析和生成。 ```python import json # 读取JSON文件 with open('data.json', 'r') as file: data = json.load(file) # 处理数据 for item in data: # 进行数据处理... pass ``` 2. 处理CSV数据: `csv`模块用于解析和写入CSV文件,它允许你读取CSV文件中的数据,并且将其转换为Python中的列表和字典。 ```python import csv # 读取CSV文件 with open('data.csv', newline='') as csvfile: reader = csv.DictReader(csvfile) for row in reader: # 处理每一行数据... pass ``` 3. 处理数据库dump文件: 数据库的dump文件通常需要使用相应的数据库管理系统(如MySQL、PostgreSQL等)的工具来恢复,但也可以使用Python的数据库连接库如`pymysql`、`psycopg2`等来编写脚本处理。 以MySQL为例: ```python import pymysql # 连接数据库 conn = pymysql.connect(host='localhost', user='user', password='password', db='database') # 创建游标 with conn.cursor() as cursor: # 执行SQL查询 cursor.execute("SELECT * FROM your_table") # 获取查询结果 records = cursor.fetchall() for row in records: # 处理每条记录... pass # 关闭连接 conn.close() ``` 处理dump文件时需要注意数据格式、编码、换行符等问题,以确保数据能正确读取和处理
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值