理解UDP
UDP套接字的特点
UDP的作用到底是什么呢,为了提供可靠的数据传输服务,TCP在不可靠的IP层进行流控制,而UDP就缺少这种流控制机制。
流控制是区分UDP和TCP的最重要的标志。但若从TCP中除去流控制,所剩内容也屈指可数。可以说TCP的生命在于流控制。“与对方套接字连接及断开连接过程也属于流控制的一部分”。
UDP内部工作原理
UDP最重要的作用就是根据端口号将传到主机的数据包交付给最终的UDP套接字。
UDP高效使用
虽然貌似大部分网络都是基于TCP实现,但也有一些是基于UDP实现的。UDP也具有一定的可靠性,网络传输特性导致信息丢失频发,可若要传递压缩文件(发送1万个数据包时,只要丢失一一个就会出现问题),则必须使用TCP。但通过网络实时传输视频或音频时的情况有所不同。对于多媒体数据而言,丢失一部分也没有太大问题,这只会引起短暂的画面抖动,或出现细微的杂音。但因为需要提供实时服务,速度就成为非常重要的因素。因此,前面的流控制就显得有些多余,此时需要考虑使用UDP。单UDP并非每次都快于TCP,TCP比UDP慢的原因通常有以下两点:
1. 收发数据前后进行的连接设置及清除过程
2. 收发数据过程中为保证可靠性而添加的流控制
如果收发的数据量小但需要频繁连接时,UDP比TCP更高效。
实现基于UDP的服务器端/客户端
UDP中的服务器端和客户端没有连接
UDP服务器端/客户端不像TCP那样在连接状态下交换数据,因此与TCP不同,无需经过连接过程。也就是说,不必调用TCP连接过程中调用的listen函数和accept函数。UDP中只有创建套接字的过程和数据交换过程。
UDP服务器端和客户端只需1个套接字
TCP中,套接字之间是一对一的关系,若要向10个客户端提供服务,除了守门的服务器套接字之外,还需要10个服务器端套接字。但在UDP中,不管是服务器端还是客户端都只需要1个套接字就可以向任意主机传输数据。
基于UDP的数据I/O函数
创建好TCP套接字后,传输数据时无需再添加地址信息。因为TCP套接字将保持与对方套接字的连接。也就是说TCP套接字知道目标地址信息。接下来介绍填写地址并传输数据时调用的UDP相关函数。
#include <sys/socket.h>
ssize_t sendto(int sock, void *buff, size_t nbytes, int flags,
struct sockaddr *to, socklen_t addrlen)
sock: 用于传输数据的UDP套接字文件描述符
buff: 保存待传输数据的缓冲地址值
nbytes: 待传输数据长度,以字节为单位
flags: 可选项参数,若没有则传递0
to: 存有目标地址信息的sockaddr结构体变量的地址值
addrlen: 传递给参数to的地址值结构体变量长度
成功时返回传输的字节数,失败时返回-1
接下来介绍接收UDP数据的函数。
#include <sys/socket.h>
ssize_t recvfrom(int sock, void *buff, size_t nbytes, int flags,
struct sockaddr*from, socklen_t*addrlen)
sock: 用于接收数据的UDP套接字文件描述符
buff: 保存接收数据的缓冲地址值
nbytes: 可接收的最大字节数,故无法超过参数buff所指的缓冲大小
flags: 可选项参数,若没有则传入0
from: 存有发送端地址信息的sockaddr结构体变量的地址值
addrlen: 保存参数from的结构体变量长度的变量地址值
成功时返回传输的字节数,失败时返回-1
编写UDP程序最核心的部分就是上述两个函数,这也说明二者在UDP数据传输中的地位。
基于UDP的回声服务器端/客户端
下面结合之前的内容实现回声服务器。需要注意的是,UDP不同于TCP,不存在请求连接和受理过程,因此在某种意义上无法明确区分服务器端和客户端。只是因其提供服务而称为服务器端,希望大家不要误解。
uecho_server.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#define BUF_SIZE 1024
void error_handling(char *message);
int main(int argc, char *argv[])
{
int serv_sock;
char message[BUF_SIZE];
int str_len;
struct sockaddr_in serv_addr,clnt_addr;
socklen_t clnt_addr_size;
if(argc != 2)
{
printf("Usage : %s <port>\n",argv[0]);
exit(1);
}
serv_sock = socket(PF_INET,SOCK_DGRAM,0);
if(serv_sock == -1)
error_handling("UDP socket creation error");
memset(&serv_addr, 0, sizeof(serv_addr));
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
serv_addr.sin_port = htons(atoi(argv[1]));
if(bind(serv_sock, (struct sockaddr *)&serv_addr, sizeof(serv_addr)) == -1)
error_handling("bind() error");
while(1)
{
clnt_addr_size = sizeof(clnt_addr);
str_len = recvfrom(serv_sock,message,BUF_SIZE, 0, (struct sockaddr*)&clnt_addr, &clnt_addr_size);
sendto(serv_sock, message, str_len, 0, (struct sockaddr*)&clnt_addr, clnt_addr_size);
}
close(serv_sock);
return 0;
}
void error_handling(char *message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
uecho_client.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#define BUF_SIZE 1024
void error_handling(char *message);
int main(int argc, char *argv[])
{
int sock;
char message[BUF_SIZE];
int str_len;
struct sockaddr_in serv_addr,from_addr;
socklen_t addr_size;
if(argc != 3)
{
printf("Usage : %s <IP> <port>\n",argv[0]);
exit(1);
}
sock = socket(PF_INET,SOCK_DGRAM,0);
if(sock == -1)
error_handling("socket() error");
memset(&serv_addr, 0, sizeof(serv_addr));
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = inet_addr(argv[1]);
serv_addr.sin_port = htons(atoi(argv[2]));
while(1)
{
fputs("Input message(Q to quit): ", stdout);
fgets(message, BUF_SIZE, stdin);
if(!strcmp(message, "q\n") || !strcmp(message, "Q\n"))
break;
sendto(sock, message, strlen(message), 0, (struct sockaddr*)&serv_addr,sizeof(serv_addr));
addr_size = sizeof(from_addr);
str_len = recvfrom(sock, message, strlen(message),0,(struct sockaddr*)&from_addr, &addr_size);
message[str_len] = 0;
printf("Message from server : %s", message);
}
close(sock);
return 0;
}
void error_handling(char *message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
UDP客户端套接字的地址分配
可以看到客户端UDP中连能承担分配地址的功能的函数都没有,究竟在何时分配IP和端口号呢?
其实,如果调用sendto函数时发现尚未分配地址信息,则在首次调用sendto函数时给相应套接字自动分配IP和端口。而且此时分配的地址一直保留到程序结束为止,因此也可用来与其他UDP套接字进行数据交换。当然,ip采用主机ip,端口选未使用的任意端口号。这也是普遍的实现方式。
UDP的数据传输特性和调用connect函数
接下来将验证UDP数据传输中存在数据边界。最后讨论UDP中connect函数的调用,以此结束UDP相关讨论。
存在数据边界的UDP套接字
UDP是具有数据边界的协议,传输中调用I/O函数的次数非常重要。因此输入函数的调用次数应和输出函数的调用次数完全一致,这样才能保证接受全部已发送的数据。
bound_host1.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#define BUF_SIZE 1024
void error_handling(char *message);
int main(int argc, char *argv[])
{
int sock;
char message[BUF_SIZE];
int str_len,i;
struct sockaddr_in my_addr,your_addr;
socklen_t addr_size;
if(argc != 2)
{
printf("Usage : %s <port>\n",argv[0]);
exit(1);
}
sock = socket(PF_INET,SOCK_DGRAM,0);
if(sock == -1)
error_handling("UDP socket creation error");
memset(&my_addr, 0, sizeof(my_addr));
my_addr.sin_family = AF_INET;
my_addr.sin_addr.s_addr = htonl(INADDR_ANY);
my_addr.sin_port = htons(atoi(argv[1]));
if(bind(sock, (struct sockaddr *)&my_addr, sizeof(my_addr)) == -1)
error_handling("bind() error");
for(i = 0; i < 3; ++i)
{
sleep(5);
addr_size = sizeof(your_addr);
str_len = recvfrom(sock,message,BUF_SIZE, 0, (struct sockaddr*)&your_addr, &addr_size);
printf("Message %d: %s \n", i+1, message);
}
close(sock);
return 0;
}
void error_handling(char *message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
bound_host2.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#define BUF_SIZE 1024
void error_handling(char *message);
int main(int argc, char *argv[])
{
int sock;
char msg1[] = "Hi";
char msg2[] = "I'm another UDP host!";
char msg3[] = "Nice to meet you";
struct sockaddr_in your_addr;
socklen_t addr_size;
if(argc != 3)
{
printf("Usage : %s <IP> <port>\n",argv[0]);
exit(1);
}
sock = socket(PF_INET,SOCK_DGRAM,0);
if(sock == -1)
error_handling("socket() error");
memset(&your_addr, 0, sizeof(your_addr));
your_addr.sin_family = AF_INET;
your_addr.sin_addr.s_addr = inet_addr(argv[1]);
your_addr.sin_port = htons(atoi(argv[2]));
sendto(sock, msg1, sizeof(msg1), 0, (struct sockaddr*)&your_addr,sizeof(your_addr));
sendto(sock, msg2, sizeof(msg2), 0, (struct sockaddr*)&your_addr,sizeof(your_addr));
sendto(sock, msg3, sizeof(msg3), 0, (struct sockaddr*)&your_addr,sizeof(your_addr));
close(sock);
return 0;
}
void error_handling(char *message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
已连接UDP套接字与未连接UDP套接字
TCP套接字中需注册待传输数据的目标IP和端口号,而UDP中无需注册。因此通过sendto函数传输数据的过程大致可分为以下3个阶段:
1. 向UDP套接字注册目标IP和端口号
2. 传输数据
3. 删除UDP套接字中注册的目标地址信息
将UDP套接字变成已连接套接字会提高效率。上述3个阶段中,第一个和第三个阶段占整个通信过程近1/3的时间,缩短这部分时间将大大提高性能。
创建过程与TCP套接字创建过程一致,但socket函数的第二个参数分明是SOCK_DGRAM。创建的的确是UDP套接字。当然,针对UDP套接字调用connect函数并不意味着要与对方的UDP套接字连接,这只是向UDP套接字注册目标IP和端口信息。
之后就与TCP套接字一样,每次调用sendto函数时只需传输数据。因为指定了收发对象,所以不仅可以使用sendto、recvfrom函数,还可以使用write、read函数进行通信。
下列示例是将之前的uecho_client.c程序改成基于已连接UDP套接字的程序:
uecho_client.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#define BUF_SIZE 1024
void error_handling(char *message);
int main(int argc, char *argv[])
{
int sock;
char message[BUF_SIZE];
int str_len;
struct sockaddr_in serv_addr,from_addr;
socklen_t addr_size;
if(argc != 3)
{
printf("Usage : %s <IP> <port>\n",argv[0]);
exit(1);
}
sock = socket(PF_INET,SOCK_DGRAM,0);
if(sock == -1)
error_handling("socket() error");
memset(&serv_addr, 0, sizeof(serv_addr));
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = inet_addr(argv[1]);
serv_addr.sin_port = htons(atoi(argv[2]));
connect(sock, (struct sockaddr*)&serv_addr, sizeof(serv_addr));
while(1)
{
fputs("Input message(Q to quit): ", stdout);
fgets(message, BUF_SIZE, stdin);
if(!strcmp(message, "q\n") || !strcmp(message, "Q\n"))
break;
//sendto(sock, message, strlen(message), 0, (struct sockaddr*)&serv_addr,sizeof(serv_addr));
write(sock, message, strlen(message));
//addr_size = sizeof(from_addr);
//str_len = recvfrom(sock, message, strlen(message),0,(struct sockaddr*)&from_addr, &addr_size);
str_len = read(sock, message, sizeof(message)-1);
message[str_len] = 0;
printf("Message from server : %s", message);
}
close(sock);
return 0;
}
void error_handling(char *message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
不再说明。
基于Windows的实现
#include <windock2.h>
int sendto(SOCKET s, const char * buf, int len, int flags,
const struct sockaddr*to, int tolen);
成功时返回传输的字节数,失败时返回SOCKET_ERROR
#include <windock2.h>
int recvfrom(SOCKET s, char * buf, int len, int flag,
struct sockaddr*from, int* fromlen);
成功时返回接收的字节数,失败时返回SOCKET_ERROR
以上两个函数与Linux下的含义完全相同。客户端的实现这里也不再列出。修改方式与之前相同。
已连接套接字的话,可以用send、recv函数,而不必使用sendto、recvfrom函数。