路由器数据转发原理

最新推荐文章于 2024-07-31 21:33:26 发布

渐行渐远962

最新推荐文章于 2024-07-31 21:33:26 发布

阅读量4.1k

点赞数 2

分类专栏： TCPIP实现文章标签：内核嵌入式 linux 网络

本文链接：https://blog.csdn.net/qq516409732/article/details/109595908

版权

本文深入探讨了路由器数据转发原理，从网卡接收数据包到内存，再到内核网络协议栈的处理，包括sk_buff数据结构，以及在不同设备下如NAPI设备的接收处理流程。涉及关键过程如IP协议栈处理、软中断处理、路由查找、分片重组、网络过滤等。

摘要由CSDN通过智能技术生成

1.知识储备

1.1 TCP/IP四层模型
当前互联网上的应用都是基于TCP/IP协议来运作的，其分层的模型非常有利于互联网应用的开发。对于TCP/IP四层模型来讲，其中第二、三层（网间层和传输层）是由内核进行处理，第四层由应用程序进行处理。
内核部分提供通用的接口和详细信息以供应用程序调用，使应用程序开发者专注于应用层的实现，而不必把过多精力放在底层处理上。

TCP/IP四层模型分别完成以下的功能：
第一层：网络接口层
包括用于协作IP数据在已有网络介质上传输的协议。如定义地址解析协议（ARP/RARP），提供TCP/IP协议的数据结构和实际物理硬件之间的接口。
第二层：网间层
本层包含IP协议负责的数据包封装、寻址和路由。同时还包含ICMP（网络控制管理报文协议）用来提供网络诊断功能，以使得在不可靠的IP协议上得以辅助可靠的服务。
第三层：传输层
它提供端到端的通信服务，其中TCP协议提供可靠的数据流传输服务，UDP提供不可靠的数据流传输服务。
第四层：应用层
应用层包括FTP、HTTP、Telnet、SMTP等服务。

1.2 LINUX网络协议栈数据结构sk_buff简介
sk_buff是linux网络协议栈最重要的数据结构。大部分内核网络模块都是直接操作sk_buff（减少内存拷贝次数），如路由子系统，防火墙系统netfilter，流量控制系统tc等等。

数据包在内核中经历的过程，实际上就是sk_buff结构中的变量不断的被读取和赋值的过程，真实的数据并不会被拷贝。例如数据包到达IP层，去掉MAC层头部，实际的操作是在MAC层函数处理结束时，只是把skb->data指针指向MAC层协议头的末尾（即IP包头的开始），并不会真的把MAC层协议头的内存清除，没有产生内存的申请与释放操作，只是一个指针的重新赋值，大大的提高了处理效率。

1.3 sk_buff结构

struct sk_buff {
     
    /* These two members must be first. */  
    struct sk_buff      *next;  
    struct sk_buff      *prev;  
  
//表示拥有此sk_buff的socket，主要是被4层用到，若http的80端口，若此sk_buff只在转发中用到，即源地址和目的地址都不是本机地址，这个指针是NULL  
    struct sock     *sk;  
//表示这个skb被接收的时间。  
    ktime_t         tstamp;  
//这个表示一个网络设备，当skb为输出时它表示skb将要输出的设备，当接收时，它表示输入设备。要注意，这个设备有可能会是虚拟设备如PPP接口(在3层以上看来)  
    struct net_device   *dev;  
//这里表示目的入口，最终生成的IP数据报路由形态，进入的数据包通过路由查询，如果发现是投递到本地的数据，则把该值赋值为ip_local_deliver,如果是转发的数据，则把该值赋值ip_forward,该头部还包含其余路由相关信息  
    struct  dst_entry  *dst;  
#ifdef CONFIG_XFRM 
// 用于IPSEC，记录安全转换信息
    struct  sec_path    *sp;  
#endif  
//这个域很重要，我们下面会详细说明。这里只需要知道这个域是保存每层的控制信息的就够了。  
    char            cb[48];  
//这个长度表示当前的skb中的数据的长度，这个长度即包括buf中的数据也包括切片的数据，也就是保存在skb_shared_info中的数据。这个值是会随着从一层到另一层而改变的。如在ip层时代表ip层的长度，在数据链路层代表数据链路层的长度
    unsigned int    len,  
//用于数据包被分片存储时，也就是skb_shared_info中的长度。不同于ip分片，只是在内存中用不连续的空间存储数据包
                data_len;  
//这个长度表示mac头的长度(2层的头的长度)  
    __u16       mac_len,  
//这个主要用于clone的时候，它表示clone的skb的头的长度。  
                hdr_len;  
  
//接下来是校验相关的域，以太网校对和  
    union {
     
        __wsum      csum;  
        struct {
     
            __u16   csum_start;  
            __u16   csum_offset;  
        };