35-嗨,别忘了UDP这个小兄弟

1、嗨,别忘了UDP这个小兄弟

讲讲 UDP 方面的编程知识。

UDP 是一种“数据报”协议,而 TCP 是一种面向连接的“数据流”协议。

TCP 类似打电话;

  • 在这个例子中,拨打号码、接通电话、开始交流,分别对应了 TCP 的三次握手和报文传送。
  • 一旦双方的连接建立,那么双方对话时,一定知道彼此是谁。这个时候我们就说,这种对话是有上下文的。

UDP类似寄明信片:

  • 在这个例子中,发信方在明信片中填上了接收方的地址和邮编,投递到邮局的邮筒之后,就可以不管了;
  • 发信方也可以给这个接收方再邮寄第二张、第三张,甚至是第四张明信片,但是这几张明信片之间是没有任何关系的,他们的到达顺序也是不保证的,有可能最后寄出的第四张明信片最先到达接收者的手中,因为没有序号,接收者也不知道这是第四张寄出的明信片;
  • 而且,即使接收方没有收到明信片,也没有办法重新邮寄一遍该明信片。

TCP 是一个面向连接的协议,TCP 在 IP 报文的基础上,增加了诸如重传、确认、有序传输、拥塞控制等能力,通信的双方是在一个确定的上下文中工作的。

而 UDP 则不同,UDP 没有这样一个确定的上下文,它是一个不可靠的通信协议,没有重传和确认,没有有序控制,也没有拥塞控制。我们可以简单地理解为,在 IP 报文的基础上,UDP 增加的能力有限。

​ UDP 不保证报文的有效传递,不保证报文的有序,也就是说使用 UDP 的时候,我们需要做好丢包、重传、报文组装等工作。

为什么我们还要使用 UDP 协议呢?

  • UDP 比较简单,适合的场景还是比较多的,我们常见的 DNS 服务,SNMP 服务都是基于 UDP 协议的,这些场景对时延、丢包都不是特别敏感。
  • 另外多人通信的场景,如聊天室、多人游戏等,也都会使用到 UDP 协议。

1.1、UDP 编程

UDP 程序设计时的主要过程:

img
  • 服务器端创建 UDP 套接字之后,绑定到本地端口,调用 recvfrom 函数等待客户端的报文发送
  • 客户端创建套接字之后,调用 sendto 函数往目标地址和端口发送 UDP 报文
  • 然后客户端和服务器端进入互相应答过程。

recvfrom 和 sendto 是 UDP 用来接收和发送报文的两个主要函数:


#include <sys/socket.h>

ssize_t recvfrom(int sockfd, void *buff, size_t nbytes, int flags, 
          struct sockaddr *from, socklen_t *addrlen); 

ssize_t sendto(int sockfd, const void *buff, size_t nbytes, int flags,
                const struct sockaddr *to, socklen_t addrlen); 

recvfrom 函数:

参数:

  • sockfd、buff 和 nbytes 是前三个参数。sockfd 是本地创建的套接字描述符,buff 指向本地的缓存,nbytes 表示最大接收数据字节。
  • 第四个参数 flags 是和 I/O 相关的参数,这里我们还用不到,设置为 0。
  • 后面两个参数 from 和 addrlen,实际上是返回对端发送方的地址和端口等信息;(**和TCP的区别:**TCP 是通过 accept 函数拿到的描述字信息来决定对端的信息。)

另外 UDP 报文每次接收都会获取对端的信息,也就是说报文和报文之间是没有上下文的。

**返回值:**实际接收的字节数;

sendto 函数:

参数:

  • sendto 函数中的前三个参数为 sockfd、buff 和 nbytes。sockfd 是本地创建的套接字描述符,buff 指向发送的缓存,nbytes 表示发送字节数;
  • 第四个参数 flags 依旧设置为 0;
  • 后面两个参数 to 和 addrlen,表示发送的对端地址和端口等信息。

**返回值:**实际发送的字节数;

我们知道, TCP 的发送和接收每次都是在一个上下文中,类似这样的过程:

A 连接上: 接收→发送→接收→发送→…

B 连接上: 接收→发送→接收→发送→ …

UDP每次接收和发送都是一个独立的上下文,类似这样:

接收 A→发送 A→接收 B→发送 B →接收 C→发送 C→ …

1.2、UDP 服务端例子

#include "lib/common.h"

static int count;

static void recvfrom_int(int signo) {
    printf("\nreceived %d datagrams\n", count);
    exit(0);
}


int main(int argc, char **argv) {
    int socket_fd;
    socket_fd = socket(AF_INET, SOCK_DGRAM, 0);

    struct sockaddr_in server_addr;
    bzero(&server_addr, sizeof(server_addr));
    server_addr.sin_family = AF_INET;
    server_addr.sin_addr.s_addr = htonl(INADDR_ANY);
    server_addr.sin_port = htons(SERV_PORT);

    bind(socket_fd, (struct sockaddr *) &server_addr, sizeof(server_addr));

    socklen_t client_len;
    char message[MAXLINE];
    count = 0;

    signal(SIGINT, recvfrom_int);

    struct sockaddr_in client_addr;
    client_len = sizeof(client_addr);
    for (;;) {
        int n = recvfrom(socket_fd, message, MAXLINE, 0, (struct sockaddr *) &client_addr, &client_len);
        message[n] = 0;
        printf("received %d bytes: %s\n", n, message);

        char send_line[MAXLINE];
        sprintf(send_line, "Hi, %s", message);

        sendto(socket_fd, send_line, strlen(send_line), 0, (struct sockaddr *) &client_addr, client_len);

        count++;
    }

}
  • 程序的 12~13 行,首先创建一个套接字,注意这里的套接字类型是“SOCK_DGRAM”,表示的是 UDP 数据报
  • 15~21 行和 TCP 服务器端类似,绑定数据报套接字到本地的一个端口上。
  • 27 行为该服务器创建了一个信号处理函数,以便在响应“Ctrl+C”退出时,打印出收到的报文总数。
  • 31~42 行是该服务器端的主体,通过调用 recvfrom 函数获取客户端发送的报文,之后我们对收到的报文进行重新改造,加上“Hi”的前缀,再通过 sendto 函数发送给客户端对端。

1.3、UDP 客户端例子

**UDP 客户端:**在这个例子中,从标准输入中读取输入的字符串后,发送给服务端,并且把服务端经过处理的报文打印到标准输出上。

#include "lib/common.h"

# define    MAXLINE     4096

int main(int argc, char **argv) {
    if (argc != 2) {
        error(1, 0, "usage: udpclient <IPaddress>");
    }
    
    int socket_fd;
    socket_fd = socket(AF_INET, SOCK_DGRAM, 0);

    struct sockaddr_in server_addr;
    bzero(&server_addr, sizeof(server_addr));
    server_addr.sin_family = AF_INET;
    server_addr.sin_port = htons(SERV_PORT);
    inet_pton(AF_INET, argv[1], &server_addr.sin_addr);

    socklen_t server_len = sizeof(server_addr);

    struct sockaddr *reply_addr;
    reply_addr = malloc(server_len);

    char send_line[MAXLINE], recv_line[MAXLINE + 1];
    socklen_t len;
    int n;

    while (fgets(send_line, MAXLINE, stdin) != NULL) {
        int i = strlen(send_line);
        if (send_line[i - 1] == '\n') {
            send_line[i - 1] = 0;
        }

        printf("now sending %s\n", send_line);
        size_t rt = sendto(socket_fd, send_line, strlen(send_line), 0, (struct sockaddr *) &server_addr, server_len);
        if (rt < 0) {
            error(1, errno, "send failed ");
        }
        printf("send bytes: %zu \n", rt);

        len = 0;
        n = recvfrom(socket_fd, recv_line, MAXLINE, 0, reply_addr, &len);
        if (n < 0)
            error(1, errno, "recvfrom failed");
        recv_line[n] = 0;
        fputs(recv_line, stdout);
        fputs("\n", stdout);
    }

    exit(0);
}
  • 10~11 行创建一个类型为“SOCK_DGRAM”的套接字;
  • 13~17 行,初始化目标服务器的地址和端口;
  • 28~51 行为程序主体,从标准输入中读取的字符进行处理后,调用 sendto 函数发送给目标服务器端;
  • 然后再次调用 recvfrom 函数接收目标服务器发送过来的新报文,并将其打印到标准输出上;

1.4、三种场景理解TCP和UDP的区别

场景一:只运行客户端

如果我们只运行客户端,程序会一直阻塞在 recvfrom 上。

$ ./udpclient 127.0.0.1
1
now sending g1
send bytes: 2
<阻塞在这里>

TCP 程序如果不开启服务端,TCP 客户端的 connect 函数会直接返回“Connection refused”报错信息。

而在 UDP 程序里,则会一直阻塞在这里。

场景二:先开启服务端,再开启客户端

先开启服务端在端口侦听,然后再开启客户端:

$./udpserver
received 2 bytes: g1
received 2 bytes: g2
$./udpclient 127.0.0.1
g1
now sending g1
send bytes: 2
Hi, g1
g2
now sending g2
send bytes: 2
Hi, g2

我们在客户端一次输入 g1、g2,服务器端在屏幕上打印出收到的字符,并且可以看到,我们的客户端也收到了服务端的回应:“Hi,g1”和“Hi,g2”。

场景三: 开启服务端,再一次开启两个客户端

这个实验中,在服务端开启之后,依次开启两个客户端,并发送报文。

服务端:

$./udpserver
received 2 bytes: g1
received 2 bytes: g2
received 2 bytes: g3
received 2 bytes: g4

第一个客户端:

$./udpclient 127.0.0.1
now sending g1
send bytes: 2
Hi, g1
g3
now sending g3
send bytes: 2
Hi, g3

第二个客户端:

$./udpclient 127.0.0.1
now sending g2
send bytes: 2
Hi, g2
g4
now sending g4
send bytes: 2
Hi, g4

两个客户端发送的报文,依次都被服务端收到,并且客户端也可以收到服务端处理之后的报文。

如果我们此时把服务器端进程杀死,就可以看到信号函数在进程退出之前,打印出服务器端接收到的报文个数。

$ ./udpserver
received 2 bytes: g1
received 2 bytes: g2
received 2 bytes: g3
received 2 bytes: g4
^C
received 4 datagrams

再重启服务器端进程!

并使用客户端 1 和客户端 2 继续发送新的报文,我们可以看到和 TCP 非常不同的结果。

服务器端的输出:

$ ./udpserver
received 2 bytes: g1
received 2 bytes: g2
received 2 bytes: g3
received 2 bytes: g4
^C
received 4 datagrams
$ ./udpserver
received 2 bytes: g5
received 2 bytes: g6

服务器端重启后可以继续收到客户端的报文;

这在 TCP 里是不可以的,TCP 断联之后必须重新连接才可以发送报文信息。

但是 **UDP 报文的“无连接”**的特点,可以在 UDP 服务器重启之后,继续进行报文的发送,这就是 UDP 报文“无上下文”的最好说明。

第一个客户端:

$./udpclient 127.0.0.1
now sending g1
send bytes: 2
Hi, g1
g3
now sending g3
send bytes: 2
Hi, g3
g5
now sending g5
send bytes: 2
Hi, g5

第二个客户端:

$./udpclient 127.0.0.1
now sending g2
send bytes: 2
Hi, g2
g4
now sending g4
send bytes: 2
Hi, g4
g6
now sending g6
send bytes: 2
Hi, g6

总结

上面介绍了UDP 程序的例子,我们需要重点关注以下两点:

  • UDP 是无连接的数据报程序,和 TCP 不同,不需要三次握手建立一条连接;
  • UDP 程序通过 recvfrom 和 sendto 函数直接收发数据报报文。

思考题

1、recvfrom 一直处于阻塞状态中,这是非常不合理的,你觉得这种情形应该怎么处理呢?

​ 可以添加超时时间做处理,当然你也可以自己实现一个复杂的请求-确认模式,那这样就跟TCP类似了,HTTP/3就是这样做的。

2、既然 UDP 是请求 - 应答模式的,那么请求中的 UDP 报文最大可以是多大呢?

​ 用UDP协议发送时,用sendto函数最大能发送数据的长度为:65535- IP头(20) - UDP头(8)=65507字节。

​ 用sendto函数发送数据时,如果发送数据长度大于该值,则函数会返回错误。

由于IP有最大MTU,因此:

​ UDP 包的大小应该是 1500 - IP头(20) - UDP头(8) = 1472(Bytes)

​ TCP 包的大小应该是 1500 - IP头(20) - TCP头(20) = 1460 (Bytes)

3、UDP没有发送缓冲区这个概念吗?

​ 不存在UDP发送缓冲区;

​ 因为发往UDP发送缓冲区的包只要超过一定阈值(值很小)就可以发往对端。所以我们一般认为UDP是没有发送缓冲区的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

liufeng2023

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值