关于io多路复用select() 读就绪 写就绪 的浅显理解

正确理解select的读就绪(readfds)和写就绪(writefds)状态与内核空间缓冲区的关系是使用select进行高效网络编程的关键。这种关系确保了应用程序能够在适当的时机进行读写操作,最大程度地避免阻塞,从而提高了应用程序的性能和响应能力。(深入观察程序架构后,发现确实只能最大程度避免阻塞,而不是完全规避或消除)

函数原型镇楼:

int select(int nfds, fd_set *_Nullable restrict readfds,

fd_set *_Nullable restrict writefds,

fd_set *_Nullable restrict exceptfds,

struct timeval *_Nullable restrict timeout);

第一条 对于select 来说 readfds writefds 有没有准备好 都是相对于 内核空间 的缓冲区来说,而不是用户空间我们自己定义在send recv中的buffer

对于readfds:如果一个文件描述符被认为是“准备好读取”的,则内核空间的接收缓冲区中有数据可供读取。这意味着调用read或相似函数(如recv)时,操作可以立即完成而不会阻塞,因为已经有数据在缓冲区等待处理了

对于writefds:如果一个文件描述符被认为是“准备好写入”的,则内核空间的发送缓冲区有足够的空间可用于新的输出数据。这表示你可以向该文件描述符写入数据(使用write或send等函数),而操作系统预计此操作不会因为缓冲区满而导致阻塞

第二条 读就绪不是验证客户端是否发来了数据

写就绪也不是验证客户端接收缓冲区有没有空间

读就绪 写就绪 都是相对于服务器所在的操作系统内核空间来说 与客户端无关

第三条 select在读就绪和写就绪时,系统不会发出通知,而是要等待用户自己轮询 只有epoll才具备主动通知的特性

番外篇:

使用tcp与火星上的马斯克建立通信,马:connect阻塞很久,你:accept等了很久,也就是说一定条件下这两个函数会阻塞

服务端使用select处理accept:

将服务端socket返回的sockfd放入select的readfds中,当读就绪时(表示至少有一个请求等待连接),在调用accept会有非阻塞立即连接的效果(这不是因为accept自身被设置为非阻塞,而是因为已经知道监听套接字上有事件发生)

客户端使用select处理connect:

因为connect会阻塞进程及线程,因此首先将其设为非阻塞,将socket返回的sockfd加入writefds中持续监控,一旦连接建立,fd会被标记为写就绪状态

综上总结,读就绪触发条件:

1 数据可用:套接字接收缓冲区中有未读数据,即有新的数据到达,应用程序可以执行读操作而不会被阻塞。

2 连接请求:对于监听套接字(如TCP服务器监听客户端的连接请求),有新的连接请求到达,应用程序可以调用accept而不会阻塞。

3 连接关闭:对端关闭了连接,读操作将返回0,表示EOF(文件结束)。

4 套接字错误:套接字上发生错误,需要通过读操作或其他方式来检查和清除错误状态。

综上总结,写就绪触发条件:

1 缓冲区可用:套接字的发送缓冲区有足够的空间接收新数据,应用程序可以执行写操作而不会被阻塞。这通常意味着至少可以写入一个字节的数据。

2 连接建立:对于非阻塞的连接操作(如TCP客户端尝试连接服务器),连接成功建立后,套接字会变为写就绪,表示应用程序可以开始发送数据。

3 套接字错误:如果在写操作过程中套接字遇到错误(例如,网络断开),套接字也可能被标记为写就绪,以便应用程序可以尝试写操作来获取错误状态。

番番外篇:

我们已经知道 读就绪 写就绪 只与内核缓冲区状态有关 那么内核缓冲区的状态又与什么有关?

内核缓冲区的状态又受到TCP流量控制和拥塞控制机制的影响,这些机制的行为是双方协商的结果。下面是对这一过程的进一步阐述:

发送端视角:

写就绪状态:如果发送端的内核发送缓冲区有足够空间接收应用程序的数据,即意味着套接字处于写就绪状态。在select的上下文中,这意味着可以在不阻塞的情况下执行写操作(send或write)。

无法达到写就绪状态:如果接收端停止或减慢读取其接收缓冲区中的数据,会导致其通告的窗口大小减小,进而导致发送端的TCP窗口缩减,直到可能完全用尽发送缓冲区的空间。此时,进一步的写操作将会阻塞(在阻塞模式下)或失败,返回EWOULDBLOCK/EAGAIN(在非阻塞模式下),直到发送缓冲区中有足够空间来容纳新的数据。

接收端视角:

读就绪状态:如果接收端的内核接收缓冲区中有未读取的数据,即意味着套接字处于读就绪状态。在select的上下文中,这意味着可以在不阻塞的情况下执行读操作(recv或read)。

无法达到读就绪状态:如果发送端未发送任何数据,或发送的数据尚未到达,接收端的内核缓冲区将为空,因此,套接字不会被标记为读就绪。任何尝试读取的操作将阻塞(在阻塞模式下)或立即返回,表明没有数据可读。

  • 13
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值