深入理解select模型: fd_set的实现在linux和windows下的区别及优劣分析

本文链接：https://blog.csdn.net/weixin_43558951/article/details/107840453

本文介绍了如何从零开始实现一个文件描述符集合，并对比了Linux和Windows下fd_set的不同实现。Linux使用比特数组，效率较高，而Windows采用线性表，更利于常见业务场景。在Linux下，select模型可管理更多描述符，但实际应用中可能需要额外优化。

摘要由CSDN通过智能技术生成

本文带领读者从源码作者的角度去实现一个fd_set, 并将fd_set在windows和linux下的实现进行了简单的对比和分析。需要读者有使用select模型编程的基础。

如何从零开始实现一个文件描述符集合

我们现在来做一件比较有意思的事情, 先不看源码, 而是把自己当成socket.h的作者来实现实现一个fd_set, 即完成如下结构体和宏的定义。

typedef struct{
   
	/*fd_set结构体定义*/
} fd_set;

#define FD_ISSET(fd, set)	/*判断是否存在*/
#define FD_SET(fd, set)		/*插入*/
#define FD_CLR(fd, set)		/*删除*/

首先我们知道一个socket文件描述符在linux下实际上是一个int类型, 在windows下是一个unsigned int类型, 所以本质上文件描述符就是一个数字。

那么假设我们要实现一个集合, 存储大小为[0,FD_SETSIZE)的数字, 并提供了插入,弹出,查找等功能, 现在给三分钟的时间给读者思考可以怎么实现?

相信不少聪明的读者都能想到, 我们可以用一个长度为FD_SETSIZE的比特数组, 数组的第i项表示值为i的文件描述符是否在这个集合里面。那么我们就可以简单地用以下代码实现:

typedef struct {
   
	bit	fds_bits[FD_SETSIZE];
} fd_set;

#define FD_ISSET(fd, set)    (((set)->fd_bits)[fd])
#define FD_SET(fd, set)      ((((set)->fd_bits)[fd]) = 1)
#define FD_CLR(fd, set)      ((((set)->fd_bits)[fd]) = 0)

然而, 问题在于大部分PC下的C语言编译器并没有为我们提供bit类型, 显然我们也不会使用C51这种单片机编译器编译。所以我们只能用已有的类型来模拟这个bitmap。
假设我们使用一个long int类型的数组来模拟上面的bit数组。为了简洁, 我们将该类型定义为fd_mask:

typedef long int fd_mask;

将数组每个元素所可以存储的bit个数称为NFDBITS, 计算方式为fd_mask的字节数sizeof(fd_mask)乘以每个字节所占的比特数8:

#define NFDBITS (8 * (int) sizeof(fd_mask))

从而, 为了存储FD_SETSIZE个描述符, 我们需要一个长度为FD_SETSIZE / NFDBITS的fd_mask数组, 该数组命名为fds_bits:

typedef struct {
   
	fd_mask fds_bits[__FD_SETSIZE / __NFDBITS];
} fd_set;

至此, fd_set结构体的定义已经完成, 接下来的重点在于我们如何索引到第fd个比特位, 其实也很简单。我们用fd除以每个元素的大小的商就是该比特位所在的fd_mask的下标:

#define FD_ELT(fd)	((fd) / NFDBITS))

余数就是该比特位在该fd_mask中的位置, 我们将该位置转换成掩码的形式, 即返回一个fd_mask类型, 并将相应比特位置1:

#define FD_MASK(d)	（(fd_mask) (1UL << ((d) % NFDBITS)))

通过上面两个函数, 我们就可以轻而易举地写出查找, 插入, 删除操作的实现: