[总结] 浅谈渐进式优化LinuxPcap抓包历程(部分附代码)

本文探讨了使用pcap进行网络包捕获的优化过程,从初始的阻塞式方法(增加线程和资源开销)转向非阻塞式pcap_dispatch,减少线程数量并优化网卡实例,以提高抓包效率和性能。
摘要由CSDN通过智能技术生成

前言

最近一直在做pcap抓包,需求很简单就是指定一个或多个bpf语句抓计算机上所有网卡。

历程

使用阻塞式pcap_loop

不考虑性能开销和资源开销的话的实现方式很多。

浅谈最简单的一种:

  • 使用单线程阻塞式的pcap_loop,一个线程抓一个网卡和一种bpf语句。
    • 优点:实现简单。
    • 缺点:资源开销大,线程数 = bpf数量 * 网卡数。

大致实现:

#include <string>
#include <sstream>

#include <sys/time.h>
#include <sys/ioctl.h>
#include <net/if.h>
#include <unistd.h>
#include <netinet/in.h>
#include <netinet/ip6.h>
#include <netinet/ip.h>
#include <string.h>
#include <dirent.h>

#include <netinet/tcp.h>
#include <netinet/ip_icmp.h>
#include <netinet/ether.h>

#include <pcap.h>

#define NET_CONNECT_STATUS_OPEN 0x00000001
#define NET_SNIFF_STATUS_OPEN 0x00000002

#define MAX_PACKET_SIZE 1500
#define MAX_RELAT_PACK_CACHE_SIZE 10000

typedef struct PcapThread {
    std::string name;
    std::string ip_addr;
} PcapThread;

static void* PcapThreadFunc(void * args) noexcept {
    PcapThread* pcap_thread = (PcapThread*)args;
    pcap_t *descr = nullptr;
    struct bpf_program fp;
    bpf_u_int32 net = 0;
    char errbuf[PCAP_ERRBUF_SIZE] = {0};
    descr = pcap_open_live(pcap_thread->name.c_str(), MAX_PACKET_SIZE, 0, PCAP_PACK_TIMEOUT, errbuf);
    if (nullptr == descr) {
        printf("%s pcap_open_live err", __FUNCTION__);
        return nullptr;
    }
    do {
        char filter_exp[] = "tcp";
        if (-1 == pcap_compile(descr, &fp, filter_exp, 0, net)) {
            printf("%s Couldn't install parse filter, error:%s", __FUNCTION__, pcap_geterr(descr));
            pcap_close(descr);
            return nullptr;
        }
        if (pcap_setfilter(descr, &fp) < 0) {
            printf("%s Couldn't pcap_setfilter %s, error:%s", __FUNCTION__, filter_exp, pcap_geterr(descr));
            pcap_close(descr);
            return nullptr;
        }
    } while (false);
    pcap_loop(descr, -1, PcapCallback, nullptr);
    pcap_close(descr);
    return nullptr;
}

int main(){
    char errbuf[PCAP_ERRBUF_SIZE];
    pcap_if_t* alldevs;
    pcap_if_t* device;
    int ret = -1;
    // 获取系统上的所有网络设备
    if (pcap_findalldevs(&alldevs, errbuf) == -1) {
        printf("Error finding devices: %s", errbuf);
        return 1;
    }

    std::vector<PcapThread> vec_pcap_thread;
    for (device = alldevs; device != nullptr; device = device->next) {
        for(pcap_addr_t *a=device->addresses; a!=NULL; a=a->next) {
            if(a->addr->sa_family == AF_INET){
                std::string sz_ip_addr = inet_ntoa(((struct sockaddr_in*)a->addr)->sin_addr);
                PcapThread pcap_arg;
                pcap_arg.ip_addr = sz_ip_addr;
                pcap_arg.name = device->name;
                vec_pcap_thread.push_back(pcap_arg);
            }
        }
    }

    for(auto pcap_thread: vec_pcap_thread){
        pthread_t pid = 0;
        ret = pthread_create(&(pid), nullptr, PcapThreadFunc, (void*) &pcap_thread);
        if (ret != 0) {
            printf("pthread_create error");
            break;
        }
    }

    while(1); // 也可以选择一个线程作为主进程运行
    return ret;
}

那么如何减少线程数量呢?
那就不得不提pcap_dispatch方法

使用非阻塞式pcap_dispatch

pcap_dispatch函数是非阻塞的,即可以使用循环的方式轮询查找是否捕获到数据包。

思路:

  • 根据bpf和网卡创建pcap实例
  • 所有pcap都放在一个线程使用轮询方式查找
  • 抓包成功会自动调用回调
    • 优化:线程数量大幅度减少,
    • 缺点:1.线程数 = bpf数量 2.需要创建大量网卡数量的pcap实例

优化1多网卡名创建一个pcap实例

利用pcap创建时device_name=“any”,使之多个网卡对应一个pcap实例
思路:

  • 根据bpf和网卡创建pcap实例
  • pcap都放在一个线程使用轮询方式查找
  • 抓包成功会自动调用回调
    • 优化:多个网卡对应一个pcap实例,减少了pcap实例数量
    • 缺点:
    1. 线程数 = bpf数量,pcap实例数=bpf数量,
    2. pcap_callback回调函数需要特殊解析数据包,使用any设备名,数据包结构会发生变化,需要特殊调整和特别解析。
    3. 多实例放在一个循环中可能会造成超时,影响后一个pcap实例的延迟处理

优化2使用select异步监听fd

利用pcap_get_select_fd获取socket fd,再使用select函数监听处理
思路:

  • 根据不同的bpf和多个网卡创建pcap实例
  • bpf数量的pcap都放在一个线程使用轮询方式查找
  • 抓包成功会自动调用回调
    • 优化:
      1. 线程数只有1,pcap实例数=bpf数量
      2. select去除了非响应的pcap实例,减少了pcap实例的超时造成的延迟影响
      3. 如果使用多个网卡创建多个pcap的方法影响也几乎没有影响 并且callback不需要特殊解析数据包
    • 缺点:几乎没有
#include <string>
#include <sstream>
#include <chrono>

#include <sys/time.h>
#include <sys/ioctl.h>
#include <net/if.h>
#include <unistd.h>
#include <netinet/in.h>
#include <netinet/ip6.h>
#include <netinet/ip.h>
#include <string.h>
#include <dirent.h>

#include <netinet/tcp.h>
#include <netinet/ip_icmp.h>
#include <netinet/ether.h>
#include <pcap.h>

void PcapCallback(u_char* argument, const struct pcap_pkthdr* packet_header, const u_char* packet_content) {
	// to do something
}

pcap_t * create_pcap(const char * dev, const std::string &str_filter_exp,  std::mutex *mutex){
    
    char errbuf[PCAP_ERRBUF_SIZE]; // 存储错误信息的缓冲区
    int snaplen = 65535; // 捕获数据包的长度
    int promisc = 0; // 混杂模式
    int to_ms = 1000; // 等待捕获的超时时间

    // 打开捕获设备
    pcap_t* handle = pcap_create(dev, errbuf);
    if (handle == nullptr) {
        printf("Could not create pcap handle: %s\n", errbuf);
        return nullptr;
    }

    struct bpf_program filter;
    pcap_set_snaplen(handle, snaplen);
    pcap_set_promisc(handle, promisc);
    pcap_set_timeout(handle, to_ms);
    pcap_compile(handle, &filter, str_filter_exp.c_str(), 1, 0);
    pcap_setfilter(handle, &filter);
    pcap_set_buffer_size(handle, 20 * 1024 * 1024);
    // pcap_set_immediate_mode(handle, 1);      // 开启immediate模式
    if (pcap_activate(handle) != 0) {
        printf("Could not activate pcap handle: %s\n", pcap_geterr(handle));
        pcap_close(handle);
        return nullptr;
    }

    return handle;
}

int main() {
    char errbuf[PCAP_ERRBUF_SIZE];
    pcap_if_t* alldevs;
    pcap_if_t* device;

    // 获取系统上的所有网络设备
    if (pcap_findalldevs(&alldevs, errbuf) == -1) {
        printf("Error finding devices: %s", errbuf);
        return 1;
    }
    
    std::vector<int> fds;
    std::vector<pcap *> pds;
    for (device = alldevs; device != nullptr; device = device->next) {
        for(pcap_addr_t *a=device->addresses; a!=NULL; a=a->next) {
            if(a->addr->sa_family == AF_INET){
                char* sz_ip_addr = inet_ntoa(((struct sockaddr_in*)a->addr)->sin_addr);
                std::string str_bpf_str = "tcp";
                pcap_t* pcap = create_pcap(device->name, str_filter_exp, nullptr);

                int fd = pcap_get_selectable_fd(pcap);
                fds.push_back(fd);
                pds.push_back(pcap);
            }
        }
    }
    // 释放设备列表
    pcap_freealldevs(alldevs);

    while (true)
    {
        fd_set read_fds;
        FD_ZERO(&read_fds);
        int max_fd = 0;
        for (auto &one : fds)
        {
            if (one > max_fd)
            {
                max_fd = one;
            }
            FD_SET(one, &read_fds);
        }

        struct timeval timeout;
        timeout.tv_sec = 5;
        timeout.tv_usec = 0;

        int result = select(max_fd + 1, &read_fds, NULL, NULL, &timeout);

        if (result == -1)
        {
            printf("error: select");
            break;
        }
        else if (result > 0)
        {
            std::vector<std::size_t> pds_indexs;

            for (std::size_t i = 0; i < fds.size(); i++)
            {
                if (FD_ISSET(fds[i], &read_fds))
                {
                    pds_indexs.emplace_back(i);
                }
            }

            for (std::size_t id = 0; id < pds_indexs.size(); id++)
            {
                std::size_t i = pds_indexs[id];

                //set_ns(containers[i].pid);
                int status =
                    pcap_dispatch(pds[i], -1, PcapCallback, nullptr);
                if (status < 0)
                    break;
            }
        }
        else
        {
            printf("Timeout!\n");
        }
    }

    for (auto &one : pds)
    {
        pcap_close(one);
    }
    return 0;
}

总结

优化过程很长,主要考虑是线程数量的优化,以及使用非阻塞函数pcap_dispatch过程中产生pcap实例延迟问题。

记下此文希望大家都能掌握这些技巧。

  • 4
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

二进制怪兽

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值