UDP报文的覆盖/重叠问题

最新推荐文章于 2024-03-24 19:55:56 发布

原创最新推荐文章于 2024-03-24 19:55:56 发布 · 5.3k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#server #socket #internet #struct #buffer #header

Linux 专栏收录该内容

67 篇文章

订阅专栏

本文探讨了UDP服务器如何正确处理来自多个客户端的数据包，解释了为何不会出现数据包累加或重叠的问题。此外，还分析了UDP数据包的最佳长度，并提供了编程建议。

对一个UDP Server来说，如果同时有几个UDP Client向其发送数据，而UDP Server使用了单线程串行处理的方式来处理收到的UDP报文，那么，会不会在UPD Server还没有处理完一条报文的时候，其他几个Client同时发送了数据，并且这些数据累加在一起（或者重叠在一起），导致UDP Server下一次使用recvfrom函数接收数据的时候，实际上一次接收到的数据是几个Client数据的集合（或者错乱了）呢？

答案是：不会。

我们可以做下面的实验（这是Linux下的程序）。

这是一个UDP Server的实现，它阻塞地接收Client的数据。大家会注意到，在绑定端口成功后，会sleep 10秒钟，在这期间，你可以用多个Client向这个UDP Server使劲地发不同的数据，从而观察效果。

至于Client，我们可以直接使用其他工具来模拟（例如TCP/UDP调试助手），不需要编写代码了。

// 编译命令 : g++ udp.cpp -o udp -g

#include <stdio.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <string.h> // memset()
#include <unistd.h> // close()

void set_socket_option(int &sock_fd);

int main()
{
int sock_fd = 0;

if ((sock_fd = socket(AF_INET, SOCK_DGRAM, 0)) == -1)
{
  printf("Error occured!/n");
}
else
{
  printf("Create socket successfully./n");
  set_socket_option(sock_fd);

  struct sockaddr_in local_server_addr;
  local_server_addr.sin_family = AF_INET;
  local_server_addr.sin_port = htons(7777);
  local_server_addr.sin_addr.s_addr = INADDR_ANY;
  memset(local_server_addr.sin_zero, '/0', sizeof(local_server_addr.sin_zero));

  if (bind(sock_fd, (struct sockaddr *)&local_server_addr, sizeof(struct sockaddr)) == -1)
  {
   printf("Error occured!/n");
  }
  else
  {
   printf("Listen on port 7777.../n");

usleep(1000 * 10000);

   while (true)
   {
    struct sockaddr_in client_addr;
    socklen_t sin_size = sizeof(client_addr);
    char buf[1024] = "0";
    int ret = recvfrom(sock_fd, buf, 1024, 0, (struct sockaddr *)&client_addr, &sin_size);
    printf("Size : %d. Buffer : %s/n", ret, buf);
   }

}

close(sock_fd);
}
return 0;
}

void set_socket_option(int &sock_fd)
{
int optval = 1;
setsockopt(sock_fd, SOL_SOCKET, SO_REUSEADDR, &optval, sizeof(int));

int recv_buf_size = 1048576; // 1MB
setsockopt(sock_fd, SOL_SOCKET, SO_RCVBUF, (const char*)&recv_buf_size, sizeof(recv_buf_size));

int send_buf_size = 1048576; // 1MB
setsockopt(sock_fd, SOL_SOCKET, SO_SNDBUF, (const char*)&send_buf_size, sizeof(send_buf_size));
}

实验结果是什么呢？

如果在sleep 10秒钟的时候，有两个Client，第一个先发了“AB”，第二个紧跟着发了“12”（此处：非16进制），也就是说，两个Client都分别发了2个字节的数据，那么UDP Server打印出来的信息是：

Size : 2. Buffer : AB

Size : 2. Buffer : 12

并不会出现下面的情形：

Size : 4. Buffer : AB12

所以，如前文所述，不会产生累加或重叠问题，放心地用吧。

另一个问题：有人说，一般来说报文头里会含有报文长度信息，我想先接收报文头，从报文头里解析出报文长度，然后再根据报文长度来动态分配内存，再用分配的内存来接收剩余的数据。这样做的目的可能是：报文长度未知，可能会很长，如果直接使用一个char buf[1024]或者char buf[2048]之类的太浪费了，而且不知道够不够用呢。

我们来讨论一下这种做法“值不值”。

首先，来看看下面的函数：

bool recv_msg(int &sock_fd, char *buf, int len)

{

bool res = true; // return result

struct sockaddr_in client_addr; // client's address information

socklen_t sin_size = sizeof(client_addr);

int ret = 0, total_size = 0;

while (total_size < len)

{

// if can't receive specified length in a time, we should continue receiving until get enough length

ret = recvfrom(sock_fd, buf + total_size, len - total_size, 0, (struct sockaddr *)&client_addr, &sin_size);

if (-1 == ret || 0 == ret) // error occured or the peer has performed an orderly shutdown

{

break;

res = false;

}

total_size += ret;

}

return res;

}

上面的函数，就是“收够了指定长度字节的数据才收手”的示例。

假设你想先接收报文header，并且正确的header为10个字节，如果你接收数据时，使用：

char buf[10] = "0";

recv_msg(sock_fd, buf, 10);

那么你就会发现这样的隐患：Client A由于出错，第一次只发送了3个字节的数据（实际上，仅报文头就有10个字节了），那么接收函数就会一直等待，然后，Client 1第二次发送数据正常了，发送了21个字节的数据（其中，报文头有10个字节），那么UDP Server就会继续把这21个字节中的前7个字节拿出来，与第一次接收到的3个字节凑成10个字节，当作一个报文头，然后解析。这显然是错误的，而且第二次正确的报文也被“破坏”了。所以，我不敢说先接收报文头这种做法是不是可取，至少我觉得没有意义。因为对UDP来说，局域网内的UDP数据长度应设计在1472 Bytes以下，Internet上的UDP数据长度应设计在548 Bytes以下（这两个数字是怎么来的，请看后面的转载资料），所以，用一个char buf[2048]完全足够接收完整条报文了（不需要先接收header再接收后面的部分），这个开销根本不大。如果你的UDP数据长度大于前面所说的上限，那么请考虑重新设计一下报文结构吧。

最后附上一篇不错的文章：

在进行UDP编程的时候,我们最容易想到的问题就是,一次发送多少bytes好?

当然,这个没有唯一答案，相对于不同的系统,不同的要求,其得到的答案是不一样的,我这里仅对像ICQ一类的发送聊天消息的情况作分析，对于其他情况，你或许也能得到一点帮助:

首先,我们知道,TCP/IP通常被认为是一个四层协议系统,包括链路层,网络层,运输层,应用层.

UDP属于运输层,下面我们由下至上一步一步来看:

以太网(Ethernet)数据帧的长度必须在46-1500字节之间,这是由以太网的物理特性决定的.

这个1500字节被称为链路层的MTU(最大传输单元).

但这并不是指链路层的长度被限制在1500字节,其实这这个MTU指的是链路层的数据区. 并不包括链路层的首部和尾部的18个字节.

所以,事实上,这个1500字节就是网络层IP数据报的长度限制.

因为IP数据报的首部为20字节,所以IP数据报的数据区长度最大为1480字节.而这个1480字节就是用来放TCP传来的TCP报文段或UDP传来的UDP数据报的.

又因为UDP数据报的首部8字节,所以UDP数据报的数据区最大长度为1472字节.这个1472字节就是我们可以使用的字节数。:)

当我们发送的UDP数据大于1472的时候会怎样呢？