原文链接:http://fanqiang.chinaunix.net/program/netpro/2001-09-13/2227.shtml
发信站: 华南网木棉站 (Tue Aug 4 15:43:41 1998), 转信
【 原文由 cpu 所发表 】
用过 WinSock API 网友们知道:WinSock 编程中有一很方便的地方便是其
息驱动机制,不管是底层 API 的 WSAAsyncSelect() 还是 MFC 的异步 Socket 类:
CAsyncSocket,都提供了诸如 FD_ACCEPT、FD_READ、FD_CLOSE 之类的消息
供编程人员捕捉并处理。FD_ACCEPT 通知进程有客户方 Socket 请求连接,
FD_READ 通知进程本地 Socket 有东东可读,FD_CLOSE 通知进程对方 Socket 已
关闭。那么,BSD Socket 是不是真的相形见拙呢?
非也! 'cause cpu love unix so.
BSD UNIX 中有一系统调用芳名 select() 完全可以提供类似的消息驱动机制。
cpu 郑重宣布:WinSock 的 WSAAsyncSeclet() 不过是此 select() 的 fork 版!
bill 也是 fork 出来的嘛,xixi.
select() 的机制中提供一 fd_set 的数据结构,实际上是一 long 类型的数组,
每一个数组元素都能与一打开的文件句柄(不管是 Socket 句柄,还是其他
文件或命名管道或设备句柄)建立联系,建立联系的工作由程序员完成,
当调用 select() 时,由内核根据 IO 状态修改 fd_set 的内容,由此来通知执
行了select() 的进程哪一 Socket 或文件可读,下面具体解释:
#include <sys/types.h>
#include <sys/times.h>
#include <sys/select.h>
int select(nfds, readfds, writefds, exceptfds, timeout)
int nfds;
fd_set *readfds, *writefds, *exceptfds;
struct timeval *timeout;
ndfs:select 监视的文件句柄数,视进程中打开的文件数而定,一般设为呢要监视各文件
中的最大文件号加一。
readfds:select 监视的可读文件句柄集合。
writefds: select 监视的可写文件句柄集合。
exceptfds:select 监视的异常文件句柄集合。
timeout:本次 select() 的超时结束时间。(见/usr/sys/select.h,
可精确至百万分之一秒!)
当 readfds 或 writefds 中映象的文件可读或可写或超时,本次 select()
就结束返回。程序员利用一组系统提供的宏在 select() 结束时便可判
断哪一文件可读或可写。对 Socket 编程特别有用的就是 readfds。
几只相关的宏解释如下:
FD_ZERO(fd_set *fdset):清空 fdset 与所有文件句柄的联系。
FD_SET(int fd, fd_set *fdset):建立文件句柄 fd 与 fdset 的联系。
FD_CLR(int fd, fd_set *fdset):清除文件句柄 fd 与 fdset 的联系。
FD_ISSET(int fd, fdset *fdset):检查 fdset 联系的文件句柄 fd 是否
可读写,>0 表示可读写。
(关于 fd_set 及相关宏的定义见 /usr/include/sys/types.h)
这样,你的 socket 只需在有东东读的时候才读入,大致如下:
...
int sockfd;
fd_set fdR;
struct timeval timeout = ..;
...
for(;;) {
FD_ZERO(&fdR);
FD_SET(sockfd, &fdR);
switch (select(sockfd + 1, &fdR, NULL, &timeout)) {
case -1:
error handled by u;
case 0:
timeout hanled by u;
default:
if (FD_ISSET(sockfd)) {
now u read or recv something;
/* if sockfd is father and
server socket, u can now
accept() */
}
}
}
所以一个 FD_ISSET(sockfd) 就相当通知了 sockfd 可读。
至于 struct timeval 在此的功能,请 man select。不同的 timeval 设置
使使 select() 表现出超时结束、无超时阻塞和轮询三种特性。由于
timeval 可精确至百万分之一秒,所以 Windows 的 SetTimer() 根本不算
什么。你可以用 select() 做一个超级时钟。
FD_ACCEPT 的实现?依然如上,因为客户方 socket 请求连接时,会发送
连接请求报文,此时 select() 当然会结束,FD_ISSET(sockfd) 当然大
于零,因为有报文可读嘛!至于这方面的应用,主要在于服务方的父
Socket,你若不喜欢主动 accept(),可改为如上机制来 accept()。
至于 FD_CLOSE 的实现及处理,颇费了一堆 cpu 处理时间,未完待续。
--
讨论关于利用 select() 检测对方 Socket 关闭的问题:
仍然是本地 Socket 有东东可读,因为对方 Socket 关闭时,会发一个关闭连接
通知报文,会马上被 select() 检测到的。关于 TCP 的连接(三次握手)和关
闭(二次握手)机制,敬请参考有关 TCP/IP 的书籍。
不知是什么原因,UNIX 好象没有提供通知进程关于 Socket 或 Pipe 对方关闭的
信号,也可能是 cpu 所知有限。总之,当对方关闭,一执行 recv() 或 read(),
马上回返回 -1,此时全局变量 errno 的值是 115,相应的 sys_errlist[errno]
为 "Connect refused"(请参考 /usr/include/sys/errno.h)。所以,在上
篇的 for(;;)...select() 程序块中,当有东西可读时,一定要检查 recv() 或
read() 的返回值,返回 -1 时要作出关断本地 Socket 的处理,否则 select() 会
一直认为有东西读,其结果曾几令 cpu 伤心欲断针脚。不信你可以试试:不检
查 recv() 返回结果,且将收到的东东(实际没收到)写至标准输出...
在有名管道的编程中也有类似问题出现。具体处理详见拙作:发布一个有用
的 Socket 客户方原码。
至于主动写 Socket 时对方突然关闭的处理则可以简单地捕捉信号 SIGPIPE 并作
出相应关断本地 Socket 等等的处理。SIGPIPE 的解释是:写入无读者方的管道。
在此不作赘述,请详 man signal。
以上是 cpu 在作 tcp/ip 数据传输实验积累的经验,若有错漏,请狂炮击之。
唉,昨天在 hacker 区被一帮孙子轰得差点儿没短路。ren cpu(奔腾的心) z80
补充关于 select 在异步(非阻塞)connect 中的应用,刚开始搞 socket 编程的时候
我一直都用阻塞式的 connect,非阻塞 connect 的问题是由于当时搞 proxy scan
而提出的呵呵
通过在网上与网友们的交流及查找相关 FAQ,总算知道了怎么解决这一问题.同样
用 select 可以很好地解决这一问题.大致过程是这样的:
1.将打开的 socket 设为非阻塞的,可以用 fcntl(socket, F_SETFL, O_NDELAY) 完
成(有的系统用 FNEDLAY 也可).
2.发 connect 调用,这时返回 -1, 但是 errno 被设为 EINPROGRESS, 意即 connect 仍旧
在进行还没有完成.
3.将打开的 socket 设进被监视的可写(注意不是可读)文件集合用 select 进行监视,
如果可写,用 getsockopt(socket, SOL_SOCKET, SO_ERROR, &error, sizeof(int));
来得到 error 的值, 如果为零, 则 connect 成功.
在许多 unix 版本的 proxyscan 程序你都可以看到类似的过程, 另外在 solaris 精华
区->编程技巧中有一个通用的带超时参数的 connect 模块.
(http://www.fanqiang.com)