1 概述
TCP编写应用程序和使用UDP编写应用程序之间存在一些本质差异,其原因在于这两个传输层之间的差异:UDP是无连接不可靠的数据报协议,非常不同于TCP提供的面向连接的可靠字节流。使用UDP编写的一些常见应用程序由:DNS(域名系统)、NFS(网络文件系统)和SNMP(简单网络管理协议)。
图1-1给出了典型的UDP客户/服务器程序函数调用。客户不与服务器建立连接,而是只管使用sendto函数给服务器发送数据报,其中必须指定目的地(即服务器)的地址作为参数。类似地,服务器不接受来自客户的连接,而是只管调用recvfrom函数,等待来自某个客户的数据到达。recfrom将与所接收的数据报一道返回客户的协议地址,因此服务器可以把响应发送给正确的客户。
图1-1 UDP客户/服务器程序所用的套接字函数
2 recvfrom和sendto函数
这两个函数类似于标准的read和write函数,不过需要三个额外的参数。
#include <sys/socket.h>
/* Read N bytes into BUF through socket FD.
If ADDR is not NULL, fill in *ADDR_LEN bytes of it with tha address of
the sender, and store the actual size of the address in *ADDR_LEN.
Returns the number of bytes read or -1 for errors.
This function is a cancellation point and therefore not marked with
__THROW. */
extern ssize_t recvfrom (int __fd, void *__restrict __buf, size_t __n,
int __flags, __SOCKADDR_ARG __addr,
socklen_t *__restrict __addr_len);
/* Send N bytes of BUF on socket FD to peer at address ADDR (which is
ADDR_LEN bytes long). Returns the number sent, or -1 for errors.
This function is a cancellation point and therefore not marked with
__THROW. */
extern ssize_t sendto (int __fd, const void *__buf, size_t __n,
int __flags, __CONST_SOCKADDR_ARG __addr,
socklen_t __addr_len);
前三个参数__fd、__buf和__n等同于read和write函数的三个参数:描述符、指向读入或写出缓冲区的指针和读写字节数。
sendto的__addr参数指向一个含有数据接收者的协议地址(如IP地址及端口号)的套接字地址结构,其大小由__addr_len参数指定。recvfrom的__addr参数指向一个由该函数在返回时填写数据报发送者的协议地址的套接字地址结构,而在该套接字地址结构中填写的字节数则放在__addr_len参数所指的整数中返回给调用者。注意,sendto的最后一个参数是一个整数值,而recvfrom的最后一个参数是一个指向整数值的指针(即值-结果参数)。
recvfrom的最后两个参数类似于accept的最后两个参数:返回时其中套接字地址结构的内容告诉我们是谁发送了数据报(UDP情况下)或是谁发起了连接(TCP情况下)。sendto的最后两个参数类似于connect的最后两个参数:调用时其中套接字地址结构被我们填入数据报将发往(UDP情况下)或与之建立连接(TCP情况下)的协议地址。
这两个函数都把所读写数据的长度作为函数返回值。在recvfrom使用数据报协议的典型用途中,返回值就是所接收数据报中的用户数据量。
写一个长度为0的数据报是可行的。在UDP情况下,这会形成一个只包含一个IP首部(对于IPv4通常是20字节,对于IPv6通常是40字节)和一个8字节UDP首部而没有数据的IP数据报。这也意味着对于数据报协议,recvfrom返回0值是可接受的:它并不像TCP套接字上read返回0值那样表示对端已关闭连接。既然UDP是无连接的,因此也就没有诸如关闭一个UDP连接之类事情。
如果recvfrom的__addr参数是一个空指针,那么相应的长度参数(addrlen)也必须是一个空指针,表示我们并不关心数据发送者的协议地址。
recvfrom和sendto都可用于TCP,尽管通常没有理由这样做。
3 UDP回射服务器程序:main函数
我们的UDP客户程序和服务器程序依循图1-1中所示的函数调用流程。图1-2描述了它们使用的函数。
图1-2 使用UDP的简单回射客户/服务器
下面是main函数。
#define SERV_PORT 9877
int main( int argc, char **argv )
{
int sockfd;
struct sockaddr_in servaddr, cliaddr;
// 我们通过将socket函数的第二个参数指定为SOCK_DGRAM(IPv4协议中的数据报套接字)创建一个UDP套接字。正如
// TCP服务器程序的例子,用于bind的服务器IPv4地址被指定为INADDR_ANY,而服务器的众所周知端口是9877
sockfd = socket( AF_INET, SCOK_DGRAM, 0 );
bzero( &servaddr, sizeof( servaddr ) );
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = htonl( INADDR_ANY );
seraddr.sin_port = htons( SERV_PORT );
if( ( bind( sockfd, ( struct sockaddr* ) &servaddr, sizeof(servaddr) ) ) < 0 )
{
printf( " bind error!\n " );
return -1;
}
// 接着调用函数dg_echo来执行服务器的处理工作
dg_echo( sockfd, ( struct sockaddr* ) &servaddr, sizeof( cliaddr ) );
}
4 UDP回射服务器程序:dg_echo函数
下面给出dg_echo函数。
void dg_echo( int sockfd, struct sockaddr * pcliaddr, socklen_t clilen )
{
int n;
socklen_t len;
char mesg[ MAXLINE ];
// 该函数是一个简单的循环,它使用recvfrom读入下一个到达服务器端口的数据报,再使用sendto把它发送回发送者。
for( ; ; )
{
len = clilen;
n = recvfrom( sockfd, mesg, MAXLINE, 0, pcliaddr, &len );
sendto( sockfd, mesg, n, 0, pcliaddr, len );
}
}
首先,该函数永不终止,因为UDP是一个无连接的协议,它没有像TCP中EOF之类的东西。
其次,该函数提供的是一个迭代服务器(iterative server),而不是像TCP服务器那样可以提供一个并发服务器。其中没有对fork的调用,因此单个服务器进程就得处理所有客户。一般来说,大多数TCP服务器是并发的,而大多数UDP服务器是迭代的。
对于本套接字,UDP层隐含有排队发生。事实上每个UDP套接字都有一个接收缓冲区,到达该套接字的每个数据报都进入这个套接字接收缓冲区。当进程调用recvfrom时,缓冲区中的下一个数据报以FIFO(先入先出)顺序返回给进程。这样,在进程能够读该套接字中任何已排好的数据报之前,如果有多个数据报到达该套接字,那么相继到达的数据报仅仅加到该套接字的接收缓冲区。然而这个缓冲区的大小是有限的。可以用SO_RECVNUF套接字选项来改变大小。
图1-3总结了TCP客户/服务器在两个客户与服务器建立连接时的情形。
图1-3 两个客户的TCP客户/服务器小结
服务器主机上有两个已连接套接字,其中每一个都由各自的套接字接收缓冲区。
图1-4展示了两个客户发送数据报到UDP服务器的情形。
图1-4 两个客户的UDP客户/服务器小结
其中只有一个服务器进程,它仅有的单个套接字用于接收所有到达的数据报并发回所有的响应。该套接字有一个接收缓冲区用来存放所到达的数据报。
上面的main函数是协议相关的(它创建一个AF_INET协议的套接字,分配并初始化一个IPv4套接字的地址结构),而dg_echo函数是协议无关的。dg_echo协议无关理由如下:调用者必须分配一个正确大小的套接字地址结构,且指向该结构的指针和该结构的大小都必须作为参数传递给dg_echo。dg_echo绝不查看这个协议相关结构的内容,而是简单地把一个指向该结构的指针传递给recvfrom和senfto。recvfrom返回时把客户的IP地址和端口号填入该结构,而随后作为目的地址传递给sendto的又是同一个指针(pcliaddr),这样所接收的任何数据报就被回射给发送该数据报的客户。
5 UDP回射客户程序:main函数
UDP客户程序的main函数。
int main( int argc, char **argv )
{
int sockfd;
struct sockaddr_in servaddr;
if( argc != 2 )
{
printf( " usage: udpcli <IPaddress> \n" );
exit( 1 );
}
// 把服务器的IP地址和端口号填入一个IPv4的套接字地址结构。该结构将传递给dg_cli函数,以指明数据报将发往何处。
bzero( &servaddr, sizeof( servaddr ) );
servaddr.sin_famliy = AF_INET;
servaddr.sin_port = htons( SERV_PORT );
inet_pton( AF_INET, argv[ 1 ], &servaddr.sin_addr );
sockfd = socket( AF_INET, SOCK_DGRAM, 0 );
dg_cli( stdin, sockfd, ( struct sockaddr * ) &servaddr, sizeof( servaddr ) );
exit( 0 );
}
6 UDP回射客户程序:dg_cli函数
下面是dg_cli函数,它执行客户的大部分工作。
void dg_cli( FILE *fp, int sockfd, const struct sockaddr *pservaddr, socklen_t servlen )
{
int n;
char sendline[ MAXLINE ], recvline[ MAXLINE + 1 ];
// 客户处理循环有四个步骤:使用fgets从标准输入读入一个文本行,使用sendto将该文本行发送给服务器,使用
// recvfrom读回服务器的回射,使用fputs把回射的文本行显示到标准输出。
while( fgets( sendline, MANLINE, fd ) != NULL )
{
sendto( sockfd, sendline, strlen( sendline ), 0, pservaddr, servlen );
n = recvfrom( sockfd, recvline, MAXLINE, 0, NULL, NULL );
recvline[ n ] = 0; // null terminate
fputs( recvline, stdout );
}
}
7 数据报的丢失
这个UDP客户/服务器例子是不可靠的。如果一个客户数据报丢失(譬如说,被客户主机与服务器主机之间的某个路由器丢弃),客户将永远阻塞在dg_cli函数中的recvfrom调用,等待一个永远不会到达的服务器应答。防止这样永久阻塞的一般方法是给客户的recvfrom调用设置一个超时。
然而仅仅设置超时并不是完整的解决办法,因为我们不能知道超时的原因。
8 验证接收到的响应
客户临时端口号的任何进程都可往客户发送数据报,而且这些数据报会与正常的服务器应答混杂。解决办法是把recvfrom调用以返回数据报发送者的IP地址和端口号,保留来自数据报所发往服务器的应答,而忽略任何其他数据报。
首先把main函数改为标准回射服务器。
servaddr.sin_port = htons( 7 );
我们接着重写dg_cli函数以分配另一个套接字地址结构用于存放由recvfrom返回的结构。
void dg_cli( FILE *fp, int sockfd, const struct sockaddr *pservaddr, socklen_t servlen )
{
int n;
char sendline[ MAXLINE ], recvline[ MAXLINE + 1 ];
socklen_t len;
struct sockaddr *preply_addr;
preply_addr = malloc( servlen );
while( fgets( sendline, MAXLINE, fp ) != NULL )
{
sendto( sockfd, sendline, strlen( sendline ), 0, pservaddr, servlen );
n = recvfrom( sockfd, recvline, MAXLINE, 0, preply_addr, &len );
if( len != servlen || memcmp( pservaddr, preply_addr, len ) != 0 )
{
printf( " reply from %s ( ignored )\n ", sock_ntop( preply_addr, len ) );
continue;
}
recvline[ n ] = 0; // null terminate
fputs( recvline, stdout );
}
}