Linux内核网络协议栈TCP/IP分析:ip分片重组

5 篇文章 0 订阅
3 篇文章 0 订阅

一 概述
在之前的一篇博文Linux内核网络协议栈TCP/IP分析之三:网络层分析了IP网络层协议,下面基于Linux 2.4.9内核代码着重分析IP分片重组。
二 IP分片
ip-head-1
2.1 标志
  与分片有关的是’标志’字段,标志字段占3bit。目前只有前两个比特有意义。
|R|DF|MF|
R:保留未用。  
DF:Don’t Fragment,“不分片”位,如果将这一比特置1 ,IP层将不对数据报进行分片。  
MF:More Fragment,“更多的片”,除了最后一片外,其他每个组成数据报的片都要把该比特置1。
2.2 MTU
  MTU: Maxitum Transmission Unit 最大传输单元。
  以太网最大的数据帧是1518Bytes,刨去以太网帧的帧头(DMAC目的地址MAC48bit=6Bytes+SMAC源MAC地址48bit=6Bytes+Type域2bytes)14Bytes和帧尾CRC校验部分4Bytes(这个部门有时候大家也把它叫做FCS),那么剩下承载上层协议的地方也就是Data域最大就只能有1500Bytes. 这个值我们就把它称之为MTU。
  以太网的MTU是1500,再减去PPP的包头包尾的开销(8Bytes),就变成1492。
2.3 MSS
  MSS: Maxitum Segment Size 最大分段大小,MSS就是TCP数据包每次能够传输的最大数据分段。为了达到最佳的传输效能TCP协议在建立连接的时候通常要协商双方的MSS值,这个值TCP协议在实现的时候往往用MTU值代替(需要减去IP数据包包头的大小20Bytes和TCP数据段的包头20Bytes)所以往往MSS为1460。通讯双方会根据双方提供的MSS值得最小值确定为这次连接的最大MSS值。
  每个以太网帧都有最小的大小64bytes,最大不能超过1518bytes,对于小于或者大于这个限制的以太网帧我们都可以视之为错误的数据帧,一般的以太网转发设备会丢弃这些数据帧。(注:小于64Bytes的数据帧一般是由于以太网冲突产生的“碎片”或者线路干扰或者坏的以太网接口产生的,对于大于1518Bytes的数据帧我们一般把它叫做Giant帧,这种一般是由于线路干扰或者坏的以太网口产生)
2.4 IP分片
  链路层具有最大传输单元MTU这个特性,它限制了数据帧的最大长度,不同的网络类型都有一个上限值。以太网的MTU是1500,如果IP层有数据包要传,而且数据包的长度超过了MTU,那么IP层就要对数据包进行分片(fragmentation)操作,使每一片的长度都小于或等于MTU。什么情况,或者说什么协议会尝试发送这么长的数据?常见的有UDP和ICMP,需要特别注意的是,TCP一般不会。为什么TCP不会造成IP分片呢?原因是TCP自身支持分段:当TCP要传输长度超过MSS(Maxitum Segment Size)的数据时,会先对数据进行分段,正常情况下,MSS小于MTU,因此,TCP一般不会造成IP分片。
而UDP和ICMP就不支持这种分段功能了,UDP和ICMP认为网络层可以传输无限长(实际上有65535的限制)的数据,当这两种协议发送数据时,它们不考虑数据长度,仅在其头部添加UDP或ICMP首部,然后直接交给网络层。接着网络层IP协议对这种“身长头短”的数据进行分片,不要指望IP能很“智能”地识别传给它的数据上层头部在哪里,载荷又在哪里,它会直接将整个的数据切成N个分片,这样做的结果是,只有第一个分片具有UDP或者ICMP首部,而其它分片则没有。
 对于分片,需要拷贝IP首部和选项,以及数据。而选项的拷贝要注意:根据协议标准,某些选项只应当出现在的一个数据包片中,而其他一些则必须出现在所有的数据包中。
分片可以发生在原始发送端主机上,也可以发生在中间路由器上。
已经分片过的数据报有可能会再次进行分片(可能不止一次)。
片偏移字段指的是该片偏移原始数据报开始处的位置
当数据报被分片后,每个片的总长度值要改为该片的长度值。
在分片时,除最后一片外,其他每一片中的数据部分(除IP首部外的其余部分)必须是8字节的整数倍。
  IP数据报是指IP层端到端的传输单元(在分片之前和重新组装之后),分组是指在IP 层和链路层之间传送的数据单元。一个分组可以是一个完整的IP数据报,也可以是IP数据报的一个分片。
2.5 分片重组
  ip-reasm-1
 (1) IP分片重组的函数是ip_defrag,基本过程是建立碎片处理队列,队列中每个节点是一个链表,这个链表保存同一个连接的碎片,当碎片都到达之后进行数据包重组,或者在一定时间(缺省30秒)内所有碎片包不能到达而释放掉。
(2)ip_find函数通过提取IP部首中的IP源地址、目标地址、标识和协议作为哈希函数的输入,根据运算结果求出分片在Hash表的位置,在哈希索引单元的ipq_t链表中查找该分片所属的报文。
(3)ip_frag_reasm函数:当收到了第一个和最后一个IP分片,且收到的IP分片的最大长度等于收到的IP分片的总长度时,表明所有的IP分片已收集齐,调用ip_frag_reasm重组包。具体的,当收到第一个分片(offset=0且MF=1)时,设置q.last_in |= INET_FRAG_FIRST_IN;当收到最后一个分片(offset != 0且MF=0)时,设置q.last_in |= INET_FRAG_LAST_IN。meat和len的区别在于,IP是不可靠传输,到达的IP分片不能保证顺序,而meat表示到达IP分片的总长度,len表示到达的IP分片中偏移最大的长度。所以当满足上述条件时,IP分片一定是收集齐了的。满足重组条件,对数据包进行重组,返回重组后的数据包。
  IP包片段之间的标识号(id)是相同的.当IP包片偏量(frag_off)第14位(IP_MF)为1时, 表示该IP包有后继片段。片偏量的低13位则为该片段在完整数据包中的偏移量, 以8字节为单位.。当IP_MF位为0时,表示IP包是最后一块碎片。
  碎片重组由重组队列完成, 每一重组队列对应于(daddr,saddr,protocol,id)构成的键值,它们存在于ipq结构构成的散列链之中. 重组队列将IP包按照将片段偏移量的顺序进行排列,当所有的片段都到齐后, 就可以将队列中的包碎片按顺序拼合成一个完整的IP包.
(4)ipq_put函数:重组完成后就要将碎片队列释放掉,如果队列节点使用数为0,释放队列节点。如果30秒后重组队列内包未到齐, 则重组过程失败, 重组队列被释放,同时向发送方以ICMP协议通知失败信息.重组队列的内存消耗不得大于256k(sysctl_ipfrag_high_thresh),否则将会调用(kfree_skb)释放每支散列尾端的重组队列。

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
嵌入式Linux网络体系结构与TCP/IP协议的关系密切,是嵌入式设备网络通信功能的核心组成部分。 嵌入式Linux网络体系结构是指整个嵌入式设备上的网络通信架构,包括网络接口、网络协议、网络驱动等。其中,TCP/IP协议网络协议的核心部分。TCP/IP协议是一组网络协议的集合,包括IP协议、TCP协议、UDP协议等。它是实现网络通信的基础,负责数据包的传输和路由。 在嵌入式Linux网络体系结构中,网络接口是设备与网络连接的接口,负责将数据包传输到网络中。网络驱动是设备与操作系统之间的桥梁,负责控制网络设备的硬件和软件。TCP/IP协议则是在操作系统内核中实现的软件模块,负责处理网络数据包的封装、解析、传输和路由。 嵌入式Linux网络体系结构与TCP/IP协议的紧密结合,使得嵌入式设备能够进行网络通信。通过网络接口和网络驱动,嵌入式设备可以与网络进行连接,并通过TCP/IP协议实现数据的传输和交换。TCP/IP协议提供了可靠的数据传输机制,保证了数据的完整性和准确性。同时,它还提供了灵活的路由算法,使得数据能够在复杂的网络中传输。 总之,嵌入式Linux网络体系结构与TCP/IP协议是嵌入式设备网络通信的核心组成部分。它们共同实现了设备与网络的连接和数据的传输,为嵌入式设备提供了强大的网络通信功能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值