【Linux 内核网络协议栈源码剖析】sendto 函数剖析

最新推荐文章于 2024-09-21 13:49:16 发布

selfimpr1991

最新推荐文章于 2024-09-21 13:49:16 发布

阅读量1.2w

点赞数 10

分类专栏： OpenSource TCP/IP 计算机网络(网络协议栈源码剖析) 文章标签： udp 网络协议源码

本文链接：https://blog.csdn.net/wenqian1991/article/details/46898725

版权

OpenSource 同时被 3 个专栏收录

38 篇文章 12 订阅

订阅专栏

TCP/IP

32 篇文章 14 订阅

订阅专栏

计算机网络(网络协议栈源码剖析)

31 篇文章 105 订阅

订阅专栏

前面介绍的函数基本上都是TCP协议的，如listen，connect，accept 等函数，这都是为可靠传输协议TCP定制的。对于另一个不可靠udp协议（通信系统其可靠性交由上层应用层负责），则主要由两个函数完成，sendto 和 recvfrom 函数。这里先介绍 sendto 函数。

说明：sendto 和 recvfrom 函数不限于udp协议，这里只是udp协议当中是采用这两个函数实现的，所以就放在udp协议中介绍。

对于 udp 协议的介绍和编程实现请参考下文：UDP 客户/服务器简单 Socket 程序

简要介绍下UDP数据报格式，相比TCP数据报格式，实在是简洁不少。

上面的各个字段含义一目了然（上面是16是表示该字段占16bit，udp头部占8字节），其中长度指的是此 UDP 数据报的长度（包括 UDP 数据报头部和 “数据” 部分）。

一、应用层——sendto 函数

#include <sys/socket.h>
ssize_t sendto(int sockfd, const void *buff, size_t nbytes, int flags,
	           const struct sockaddr *to, socklen_t *addrlen);
//若成功则返回写的字节数，出错则返回-1
/*参数解析
前面三个参数分别表示：套接字描述符，指向写出缓冲区的指针和写字节数。
to：指向一个含有数据报接收者的协议地址（如IP地址和端口号）的套接字地址结构，其大小由addrlen参数指定
*/

该函数的作用是：向指定端口发送给定地址中的指定大小数据（如客户端sockfd，向 to 指定的远端套接字发送buff 缓冲区内nbytes 个字节数据）

二、BSD Socket层——sock_sendto 函数

/*
 *	Send a datagram to a given address. We move the address into kernel
 *	space and check the user space data area is readable before invoking
 *	the protocol.
 */
//发送数据给指定的远端地址，主要用于UDP协议
//前面三个参数分别表示套接口描述字、指向缓冲区的指针和读写字节数
//addr指向一个含有数据包接收者的协议地址(含ip地址和端口号)的套接口地址结构
//其大小由addr_len参数指定
//该函数的作用就是向指定地址的远端发送数据包：将buff缓冲区中len大小的数据发送给addr指定的远端套接字
static int sock_sendto(int fd, void * buff, int len, unsigned flags,
	   struct sockaddr *addr, int addr_len)
{
	struct socket *sock;
	struct file *file;
	char address[MAX_SOCK_ADDR];
	int err;
	//参数有效性检查
	if (fd < 0 || fd >= NR_OPEN || ((file = current->files->fd[fd]) == NULL))
		return(-EBADF);
	//找到给定文件描述符对应的socket结构
	if (!(sock = sockfd_lookup(fd, NULL)))
		return(-ENOTSOCK);

	if(len<0)
		return -EINVAL;
	//检查权限，buff中len个字节区域是否可读
	err=verify_area(VERIFY_READ,buff,len);
	if(err)
	  	return err;
  	//从addr拷贝addr_len大小的数据到address
	if((err=move_addr_to_kernel(addr,addr_len,address))<0)
	  	return err;
    //调用下层函数sendto,inet域为inet_sendto函数
	return(sock->ops->sendto(sock, buff, len, (file->f_flags & O_NONBLOCK),
		flags, (struct sockaddr *)address, addr_len));
}

三、INET Socket层——inet_sendto 函数

 //INET socket层
static int inet_sendto(struct socket *sock, void *ubuf, int size, int noblock, 
	    unsigned flags, struct sockaddr *sin, int addr_len)
{
    //得到socket对应的sock结构
	struct sock *sk = (struct sock *) sock->data;
	//判断该套接字的有效性，是否处于关闭状态(半关闭)
	if (sk->shutdown & SEND_SHUTDOWN) 
	{
		send_sig(SIGPIPE, current, 1);
		return(-EPIPE);
	}
	if (sk->prot->sendto == NULL) 
		return(-EOPNOTSUPP);
	if(sk->err)
		return inet_error(sk);
	/* We may need to bind the socket. */
	//自动绑定一个本地端口号
	if(inet_autobind(sk)!=0)
		return -EAGAIN;
	//调用下层传输层函数udp_sendto函数
	return(sk->prot->sendto(sk, (unsigned char *) ubuf, size, noblock, flags, 
			   (struct sockaddr_in *)sin, addr_len));
}

四、传输层

udp_sento 函数

static int udp_sendto(struct sock *sk, unsigned char *from, int len, int noblock,
	   unsigned flags, struct sockaddr_in *usin, int addr_len)
{
	struct sockaddr_in sin;
	int tmp;

	/* 
	 *	Check the flags. We support no flags for UDP sending
	 */
	 //udp除了MSG_DONTROUTE外，不支持任何其他标志位
	if (flags&~MSG_DONTROUTE) 
	  	return(-EINVAL);
	/*
	 *	Get and verify the address. 
	 */
	//对远端地址的合法性检查，由于不涉及网络数据传送，所以无法验证这个地址存在性
	
	if (usin) 
	{
	//如果明确指定远端地址，就直接检查该地址的有效性
		if (addr_len < sizeof(sin)) //大小
			return(-EINVAL);
		memcpy(&sin,usin,sizeof(sin));
		if (sin.sin_family && sin.sin_family != AF_INET) //本地地址有效性
			return(-EINVAL);
		if (sin.sin_port == 0) //端口号有效性
			return(-EINVAL);
	} 
	else 
	{
	//如果没有明确指定远端地址，则检查之前是否调用了connect函数进行了地址绑定
		if (sk->state != TCP_ESTABLISHED) 
			return(-EINVAL);
		//如果进行了绑定，则将远端地址设置为这个绑定的地址
		sin.sin_family = AF_INET;
		sin.sin_port = sk->dummy_th.dest;
		sin.sin_addr.s_addr = sk->daddr;
  	}
  
  	/*
  	 *	BSD socket semantics. You must set SO_BROADCAST to permit
  	 *	broadcasting of data.
  	 */
  	//处理尚未指定本地地址的情况
  	if(sin.sin_addr.s_addr==INADDR_ANY)
  		sin.sin_addr.s_addr=ip_my_addr();

	//处理广播的情况
  	if(!sk->broadcast && ip_chk_addr(sin.sin_addr.s_addr)==IS_BROADCAST)
	    	return -EACCES;			/* Must turn broadcast on first */

	sk->inuse = 1;//加锁

	/* Send the packet. */
	//转调用udp_send函数
	tmp = udp_send(sk, &sin, from, len, flags);

	/* The datagram has been sent off.  Release the socket. */
	//数据包以发送，释放该套接字，前面介绍到这个函数的两个功能
	//取决于sk_dead字段是否设置
	release_sock(sk);
	return(tmp);
}

udp_send 函数

 //根据被调用出清楚参数情况
static int udp_send(struct sock *sk, struct sockaddr_in *sin,
	 unsigned char *from, int len, int rt)
{
	struct sk_buff *skb;
	struct device *dev;
	struct udphdr *uh;
	unsigned char *buff;
	unsigned long saddr;
	int size, tmp;
	int ttl;
  
	/* 
	 *	Allocate an sk_buff copy of the packet.
	 */
	//计算所需要分配的封装数据的缓冲区大小 
	size = sk->prot->max_header + len;
	//分配指定大小的sk_buff 结构用于封装数据
	skb = sock_alloc_send_skb(sk, size, 0, &tmp);


	if (skb == NULL) 
		return tmp;

	skb->sk       = NULL;	/* to avoid changing sk->saddr */
	skb->free     = 1;//发送完后数据包立即释放，udp不提供超时重传
	skb->localroute = sk->localroute|(rt&MSG_DONTROUTE);//指定路由类型

	/*
	 *	Now build the IP and MAC header. 
	 */
	 
	buff = skb->data;//udp首部和有效负载
	saddr = sk->saddr;//本地地址
	dev = NULL;
	ttl = sk->ip_ttl;
#ifdef CONFIG_IP_MULTICAST
	//如果目的地址是多播，则设置TTL值为1，表示局限于本地网络，不可跨越路由器

	if (MULTICAST(sin->sin_addr.s_addr))
		ttl = sk->ip_mc_ttl;
#endif
	//创建MAC首部和IP首部
	tmp = sk->prot->build_header(skb, saddr, sin->sin_addr.s_addr,
			&dev, IPPROTO_UDP, sk->opt, skb->mem_len,sk->ip_tos,ttl);

	skb->sk=sk;//关联	/* So memory is freed correctly */
	
	/*
	 *	Unable to put a header on the packet.
	 */
	 		    
	if (tmp < 0 ) //创建失败
	{
		sk->prot->wfree(sk, skb->mem_addr, skb->mem_len);
		return(tmp);
  	}
  	
	buff += tmp;//定位到udp首部位置
	saddr = skb->saddr; /*dev->pa_addr;*/
	//数据报sk_buff中挂载的数据部分长度:下面注释，len是有效数据负载长度
	skb->len = tmp + sizeof(struct udphdr) + len;	/* len + UDP + IP + MAC */
	skb->dev = dev;//网络接口设备
	
	/*
	 *	Fill in the UDP header. 
	 */
	//udp首部字段的初始化
	uh = (struct udphdr *) buff;
	uh->len = htons(len + sizeof(struct udphdr));//长度字段
	uh->source = sk->dummy_th.source;//源端端口，sk中tcp首部字段
	uh->dest = sin->sin_port;//目的端口
	buff = (unsigned char *) (uh + 1);//定位到数据部分
	//MAC header | IP Header | UDP Header | Data
	//uh本身已经指向了udp首地址，uh+1，表示后移一个udp首部大小位置，定位到了数据负载

	/*
	 *	Copy the user data. 
	 */
	//从from拷贝len大小的数据到buff，即把应用层中待发送的缓冲区的数据拷贝到数据包的数据负载中
	//然后通过数据包整体打包发送出去。
	//就好比货物搭上了货轮开往目的地，为啥不是火车呢，因为火车线路已经固定好了，只能这么走。
	memcpy_fromfs(buff, from, len);

  	/*
  	 *	Set up the UDP checksum. 
  	 */
  	//同tcp，这里进行udp校验和检查 
	udp_send_check(uh, saddr, sin->sin_addr.s_addr, skb->len - tmp, sk);

	/* 
	 *	Send the datagram to the interface. 
	 */
	 
	udp_statistics.UdpOutDatagrams++;
	//调用ip_queue_xmit函数将数据包发往网络层模块处理。以下处理就和TCP协议一样了，二者的差异只在于传输层
	//该函数以及更下层数据传送前面已经介绍，
	sk->prot->queue_xmit(sk, dev, skb, 1);
	return(len);
}

关于ip_queue_xmit 函数的介绍以及更下层的数据传送，参见博文：【Linux 内核网络协议栈源码剖析】数据包发送

可以看出，udp是一种无连接传输层协议，不像tcp那样需要服务器监听，也不必等待客户端与服务器建立连接后才能通信，效率优于tcp协议，但udp则不能保证数据传输的可靠性。
udp 的数据传输，实现并不像tcp那样要建立一条数据传输通道，而是直接创建套接字后，直接传送数据到给定的远端（提供远端地址），数据传送过程无超时重传和序列号校验工作，适用于数据传输的连续性比数据的完整性更重要的场合，允许数据在传输过程中有部分丢失，如IP电话、流媒体通信等。