本文带领读者从源码作者的角度去实现一个fd_set, 并将fd_set在windows和linux下的实现进行了简单的对比和分析。需要读者有使用select模型编程的基础。
如何从零开始实现一个文件描述符集合
我们现在来做一件比较有意思的事情, 先不看源码, 而是把自己当成socket.h
的作者来实现实现一个fd_set
, 即完成如下结构体和宏的定义。
typedef struct{
/*fd_set结构体定义*/
} fd_set;
#define FD_ISSET(fd, set) /*判断是否存在*/
#define FD_SET(fd, set) /*插入*/
#define FD_CLR(fd, set) /*删除*/
首先我们知道一个socket文件描述符在linux下实际上是一个int
类型, 在windows下是一个unsigned int
类型, 所以本质上文件描述符就是一个数字。
那么假设我们要实现一个集合, 存储大小为[0,FD_SETSIZE)
的数字, 并提供了插入,弹出,查找等功能, 现在给三分钟的时间给读者思考可以怎么实现?
相信不少聪明的读者都能想到, 我们可以用一个长度为FD_SETSIZE
的比特数组, 数组的第i项表示值为i的文件描述符是否在这个集合里面。那么我们就可以简单地用以下代码实现:
typedef struct {
bit fds_bits[FD_SETSIZE];
} fd_set;
#define FD_ISSET(fd, set) (((set)->fd_bits)[fd])
#define FD_SET(fd, set) ((((set)->fd_bits)[fd]) = 1)
#define FD_CLR(fd, set) ((((set)->fd_bits)[fd]) = 0)
然而, 问题在于大部分PC下的C语言编译器并没有为我们提供bit类型, 显然我们也不会使用C51这种单片机编译器编译。所以我们只能用已有的类型来模拟这个bitmap。
假设我们使用一个long int
类型的数组来模拟上面的bit数组。为了简洁, 我们将该类型定义为fd_mask
:
typedef long int fd_mask;
将数组每个元素所可以存储的bit个数称为NFDBITS
, 计算方式为fd_mask
的字节数sizeof(fd_mask)
乘以每个字节所占的比特数8
:
#define NFDBITS (8 * (int) sizeof(fd_mask))
从而, 为了存储FD_SETSIZE
个描述符, 我们需要一个长度为FD_SETSIZE / NFDBITS
的fd_mask
数组, 该数组命名为fds_bits
:
typedef struct {
fd_mask fds_bits[__FD_SETSIZE / __NFDBITS];
} fd_set;
至此, fd_set
结构体的定义已经完成, 接下来的重点在于我们如何索引到第fd
个比特位, 其实也很简单。 我们用fd
除以每个元素的大小的商就是该比特位所在的fd_mask
的下标:
#define FD_ELT(fd) ((fd) / NFDBITS))
余数就是该比特位在该fd_mask
中的位置, 我们将该位置转换成掩码的形式, 即返回一个fd_mask
类型, 并将相应比特位置1:
#define FD_MASK(d) ((fd_mask) (1UL << ((d) % NFDBITS)))
通过上面两个函数, 我们就可以轻而易举地写出查找, 插入, 删除操作的实现: