UDP报文的覆盖/重叠问题

对一个UDP Server来说,如果同时有几个UDP Client向其发送数据,而UDP Server使用了单线程串行处理的方式来处理收到的UDP报文,那么,会不会在UPD Server还没有处理完一条报文的时候,其他几个Client同时发送了数据,并且这些数据累加在一起(或者重叠在一起),导致UDP Server下一次使用recvfrom函数接收数据的时候,实际上一次接收到的数据是几个Client数据的集合(或者错乱了)呢?

答案是:不会。

 

我们可以做下面的实验(这是Linux下的程序)。

这是一个UDP Server的实现,它阻塞地接收Client的数据。大家会注意到,在绑定端口成功后,会sleep 10秒钟,在这期间,你可以用多个Client向这个UDP Server使劲地发不同的数据,从而观察效果。

至于Client,我们可以直接使用其他工具来模拟(例如TCP/UDP调试助手),不需要编写代码了。

 

// 编译命令 : g++ udp.cpp -o udp -g

#include <stdio.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <string.h>  // memset()
#include <unistd.h> // close()

 

void set_socket_option(int &sock_fd);

 

int main()
{
 int sock_fd = 0;

 if ((sock_fd = socket(AF_INET, SOCK_DGRAM, 0)) == -1)
 {
  printf("Error occured!/n");
 }
 else
 {
  printf("Create socket successfully./n");
  set_socket_option(sock_fd);

  struct sockaddr_in local_server_addr;
  local_server_addr.sin_family = AF_INET;
  local_server_addr.sin_port = htons(7777);
  local_server_addr.sin_addr.s_addr = INADDR_ANY;
  memset(local_server_addr.sin_zero, '/0', sizeof(local_server_addr.sin_zero));

  if (bind(sock_fd, (struct sockaddr *)&local_server_addr, sizeof(struct sockaddr)) == -1)
  {
   printf("Error occured!/n");
  }
  else
  {
   printf("Listen on port 7777.../n");

 

   usleep(1000 * 10000);

 

   while (true)
   {
    struct sockaddr_in client_addr;
    socklen_t sin_size = sizeof(client_addr);
    char buf[1024] = "0";
    int ret = recvfrom(sock_fd, buf, 1024, 0, (struct sockaddr *)&client_addr, &sin_size);
    printf("Size : %d. Buffer : %s/n", ret, buf);
   }

  }

  close(sock_fd);
 }
 return 0;
}

 

void set_socket_option(int &sock_fd)
{
 int optval = 1;
 setsockopt(sock_fd, SOL_SOCKET, SO_REUSEADDR, &optval, sizeof(int));


 int recv_buf_size = 1048576; // 1MB
 setsockopt(sock_fd, SOL_SOCKET, SO_RCVBUF, (const char*)&recv_buf_size, sizeof(recv_buf_size));

 int send_buf_size = 1048576; // 1MB
 setsockopt(sock_fd, SOL_SOCKET, SO_SNDBUF, (const char*)&send_buf_size, sizeof(send_buf_size));
}

 

 

实验结果是什么呢?

如果在sleep 10秒钟的时候,有两个Client,第一个先发了“AB”,第二个紧跟着发了“12”(此处:非16进制),也就是说,两个Client都分别发了2个字节的数据,那么UDP Server打印出来的信息是:

 

Size : 2. Buffer : AB

Size : 2. Buffer : 12

 

并不会出现下面的情形:

Size : 4. Buffer : AB12

 

 

所以,如前文所述,不会产生累加或重叠问题,放心地用吧。

 

 

 

另一个问题:有人说,一般来说报文头里会含有报文长度信息,我想先接收报文头,从报文头里解析出报文长度,然后再根据报文长度来动态分配内存,再用分配的内存来接收剩余的数据。这样做的目的可能是:报文长度未知,可能会很长,如果直接使用一个char buf[1024]或者char buf[2048]之类的太浪费了,而且不知道够不够用呢。

我们来讨论一下这种做法“值不值”。

首先,来看看下面的函数:

 

bool recv_msg(int &sock_fd, char *buf, int len)

{

 bool res = true; // return result

 struct sockaddr_in client_addr; // client's address information 

 socklen_t sin_size = sizeof(client_addr);

 int ret = 0, total_size = 0;

 while (total_size < len)

 {

  // if can't receive specified length in a time, we should continue receiving until get enough length 

  ret = recvfrom(sock_fd, buf + total_size, len - total_size, 0, (struct sockaddr *)&client_addr, &sin_size);

  if (-1 == ret || 0 == ret) // error occured or the peer has performed an orderly shutdown 

  {

   break;

   res = false;

  }

  total_size += ret;

 }

 return res;

}

 

上面的函数,就是“收够了指定长度字节的数据才收手”的示例。

假设你想先接收报文header,并且正确的header为10个字节,如果你接收数据时,使用:

char buf[10] = "0";

recv_msg(sock_fd, buf, 10);

 

那么你就会发现这样的隐患:Client A由于出错,第一次只发送了3个字节的数据(实际上,仅报文头就有10个字节了),那么接收函数就会一直等待,然后,Client 1第二次发送数据正常了,发送了21个字节的数据(其中,报文头有10个字节),那么UDP Server就会继续把这21个字节中的前7个字节拿出来,与第一次接收到的3个字节凑成10个字节,当作一个报文头,然后解析。这显然是错误的,而且第二次正确的报文也被“破坏”了。所以,我不敢说先接收报文头这种做法是不是可取,至少我觉得没有意义。因为对UDP来说,局域网内的UDP数据长度应设计在1472 Bytes以下,Internet上的UDP数据长度应设计在548 Bytes以下(这两个数字是怎么来的,请看后面的转载资料),所以,用一个char buf[2048]完全足够接收完整条报文了(不需要先接收header再接收后面的部分),这个开销根本不大。如果你的UDP数据长度大于前面所说的上限,那么请考虑重新设计一下报文结构吧。

 

 

 

最后附上一篇不错的文章

 

在进行UDP编程的时候,我们最容易想到的问题就是,一次发送多少bytes好?   

当然,这个没有唯一答案,相对于不同的系统,不同的要求,其得到的答案是不一样的,我这里仅对像ICQ一类的发送聊天消息的情况作分析,对于其他情况,你或许也能得到一点帮助: 

首先,我们知道,TCP/IP通常被认为是一个四层协议系统,包括链路层,网络层,运输层,应用层.   

UDP属于运输层,下面我们由下至上一步一步来看:   

以太网(Ethernet)数据帧的长度必须在46-1500字节之间,这是由以太网的物理特性决定的.   

这个1500字节被称为链路层的MTU(最大传输单元).   

但这并不是指链路层的长度被限制在1500字节,其实这这个MTU指的是链路层的数据区. 并不包括链路层的首部和尾部的18个字节.   

所以,事实上,这个1500字节就是网络层IP数据报的长度限制.   

因为IP数据报的首部为20字节,所以IP数据报的数据区长度最大为1480字节.而这个1480字节就是用来放TCP传来的TCP报文段或UDP传来的UDP数据报的.   

又因为UDP数据报的首部8字节,所以UDP数据报的数据区最大长度为1472字节.这个1472字节就是我们可以使用的字节数。:)   

 

当我们发送的UDP数据大于1472的时候会怎样呢?   

这也就是说IP数据报大于1500字节,大于MTU.这个时候发送方IP层就需要分片(fragmentation).   

把数据报分成若干片,使每一片都小于MTU.而接收方IP层则需要进行数据报的重组.   

这样就会多做许多事情,而更严重的是,由于UDP的特性,当某一片数据传送中丢失时,接收方便   

无法重组数据报.将导致丢弃整个UDP数据报。   

 

因此,在普通的局域网环境下,我建议将UDP的数据控制在1472字节以下为好.   

 

进行Internet编程时则不同,因为Internet上的路由器可能会将MTU设为不同的值.   

如果我们假定MTU为1500来发送数据的,而途经的某个网络的MTU值小于1500字节,那么系统将会使用一系列的机   

制来调整MTU值,使数据报能够顺利到达目的地,这样就会做许多不必要的操作.   

 

鉴于Internet上的标准MTU值为576字节,所以我建议在进行Internet的UDP编程时. 最好将UDP的数据长度控件在548字节(576-8-20)以内.  

 

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值