深入理解TCP/IP协议的实现之ip分片(基于linux1.2.13)

上次分析了ip分片重组,这次分析一下ip分片。首先我们要先了解为什么需要分片。比如在以太网中,使用CSMA/CD协议(由网卡实现),他规定了一个链路层数据包(不包括mac头,但是这一版内核实现的时候是包括了mac头的大小)的最大值(MTU)和最小值。所以如果上层的包大于这个阈值就需要被分片。而分片和组包的实现是在ip层。我们看一下具体的逻辑。ip分片的逻辑在ip_fragment函数里实现。

void ip_fragment(
	struct sock *sk, 
	struct sk_buff *skb, 
	struct device *dev, 
	int is_frag
)

定义的一些变量。

	struct iphdr *iph;
	unsigned char *raw;
	unsigned char *ptr;
	struct sk_buff *skb2;
	int left, mtu, hlen, len;
	int offset;
	unsigned long flags;
	// mac首地址
	raw = skb->data;
	// ip头首地址,hard_header_len为mac头大小
	iph = (struct iphdr *) (raw + dev->hard_header_len);
	skb->ip_hdr = iph;
	// ip头的大小,不包括数据部分
	hlen = (iph->ihl * sizeof(unsigned long));
	// ip包总大小减去ip层等于ip报文的数据长度,即需要分片的部分的大小
	left = ntohs(iph->tot_len) - hlen;	
	// ip头+mac头
	hlen += dev->hard_header_len;	
	// 每个分片的数据部分长度等于mac层的mtu减去mac头和ip头,即mac层的mtu包括了mac头、ip头、ip数据部分的总和。
	mtu = (dev->mtu - hlen);		
	// 数据部分首地址
	ptr = (raw + hlen);		

判断是否可以分片。

	// 设置了不能分片则发送icmp报文,可以对照ip报文格式看
	if (ntohs(iph->frag_off) & IP_DF)
	{
		icmp_send(skb,ICMP_DEST_UNREACH, ICMP_FRAG_NEEDED, dev->mtu, dev);
		return;
	}

判断即将被分片的ip包是否本身也是一个分片。即经过了多次ip分片。

/*
	该ip报文本身就是一个分片,现在需要进行再次分片,
	偏移的首地址是该报文的首地址乘以8,因为再次被分片的报文,他的偏移是
	基于原来未被分片的数据的偏移。而不是针对当前这个分片的偏移
*/
	if (is_frag & 2)
		offset = (ntohs(iph->frag_off) & 0x1fff) << 3;
	else
		offset = 0

开始处理分片。

	// 还有则继续处理
	while(left > 0)
	{	
		// ip包默认承载的字节数,但是如果大于mtu的话则取小的值,即mtu
		len = left;
		// 大于mtu则还要分片,即只能承载mtu大小的字节,否则就是最后一个分片
		if (len > mtu)
			len = mtu;
		/*
			剩下的字节比mtu大的时候下面的判断会成立,
			即剩下的字节还不能在这次发送完,还要继续分片
			除8乘8即取8的倍数大小,不一定等于mtu 
		*/
		if (len < left)
		{
			len/=8;
			len*=8;
		}
		// len 为这一分片承载的数据大小
		// 申请新的skb,大小为mac头+ip头+数据部分长度
		if ((skb2 = alloc_skb(len + hlen,GFP_ATOMIC)) == NULL)
		{
			return;
		}
		
		skb2->arp = skb->arp;
		skb2->free = 1;
		// 总大小是mac头+ip头+数据部分长度
		skb2->len = len + hlen;
		// 指向刚分配的内存首地址,开始复制数据
		skb2->h.raw=(char *) skb2->data;
		save_flags(flags);
		restore_flags(flags);
		// ip地址
		skb2->raddr = skb->raddr;	
		
		// raw指向mac头首地址,这里把mac报头和ip报头+选项都复制到skb中,ip选项应该只复制到第一个分片,这里会复制到每一个分片中
		memcpy(skb2->h.raw, raw, hlen);
		// 复制数据部分,长度为len,ptr指向原ip报文中数据部分的首地址,
		memcpy(skb2->h.raw + hlen, ptr, len);

		// 剩下需要分片的字节数
		left -= len;
		// 指向ip头首地址
		skb2->h.raw+=dev->hard_header_len;
		iph = (struct iphdr *)(skb2->h.raw);
		// 设置该分片的偏移,除以8,见ip协议的规定
		iph->frag_off = htons((offset >> 3));
		/*
			1. 还有数据,则置MF,还要更多分片
			2. is_frag =1;说明该分片后面还有更多分片。
			表示被分片的数据本身就是一个ip分片,即再分片。
			所以该报文下的所有分片MF都是1。
		*/
		if (left > 0 || (is_frag & 1))
			iph->frag_off |= htons(IP_MF);
		// 更新数据指针和偏移
		ptr += len;
		offset += len;
		// 发送分片
		ip_queue_xmit(sk, dev, skb2, 2);
	}

分片主要的逻辑是
1 申请一个新的内存,把待分片报文中的mac头、ip头,复制到新内存,然后数据部分切一块继续复制到内存后面。如此,直到分片完毕
2 修改ip报文中的一些字段的值 ,比如MF。
3 调底层接口逐个发送分片
分片的逻辑不算复杂,不讲解的太详细了。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
IP协议TCP/IP协议族中的一员,它主要负责实现数据包的路由和转发功能。在IP协议中,数据包的大小是有限制的,而当数据包的大小超过了这个限制时,就需要进行分片处理。本文将介绍如何在Linux 1.2.13内核中实现IP分片功能。 1. IP数据包的分片IP协议中,每个数据包都有一个最大传输单元(MTU)的限制,也就是说,当数据包的大小超过了这个限制时,就需要进行分片处理。IP协议中规定,每个分片的大小必须是8字节的倍数,同时每个分片都有一个标识符和偏移量,以便在接收端将分片组合成完整的数据包。 2. IP分片实现Linux 1.2.13内核中,IP分片实现是通过ip_fragment函数来完成的。这个函数的主要作用是将大的IP数据包分成多个小的数据包,并设置每个小的IP数据包的标识符和偏移量。ip_fragment函数的参数如下: - skb:需要分片的数据包 - mtu:分片后每个数据包的最大长度 - want:表示是否强制进行分片ip_fragment函数中,首先会检查skb数据包的长度是否超过了mtu,如果没有超过,则直接返回。否则,就需要进行分片处理。具体的分片过程如下: - 通过skb_copy_bits函数将原始数据包的IP头部复制到每个新的数据包中 - 根据mtu和原始数据包的长度计算出需要分成多少个分片 - 遍历所有分片,设置每个分片的标识符和偏移量 - 将每个分片添加到skb数据包的队列中,并设置IP头部的总长度和MF标志位 当所有的分片都添加到队列中后,ip_fragment函数就会返回。此时,发送端就可以将每个分片发送到网络中,接收端则可以根据标识符和偏移量将所有分片组合成完整的数据包。 3. 总结 IP分片TCP/IP协议中非常重要的一部分,它可以让数据包在网络中进行传输。在Linux 1.2.13内核中,IP分片实现是通过ip_fragment函数来完成的,这个函数可以将大的IP数据包分成多个小的IP数据包,并设置每个小的IP数据包的标识符和偏移量。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值