常见Linux IO模型分析

最新推荐文章于 2024-07-18 00:25:26 发布

lsletter

最新推荐文章于 2024-07-18 00:25:26 发布

阅读量977

点赞数 2

分类专栏： io模型文章标签：同步和异步IO 多路服用IO模型 select poll epoll 模型阻塞和非阻塞IO模型

本文链接：https://blog.csdn.net/yfkscu/article/details/38141635

版权

io模型专栏收录该内容

1 篇文章 0 订阅

订阅专栏

LINUX常见IO模型介绍

UNIX中常见IO模型有五种：阻塞 IO、非阻塞IO、多路复用IO、异步IO、信号驱动IO。其中阻塞IO、非阻塞IO、多路复用IO、信号驱动IO都属于同步IO。

同步IO和异步IO

同步IO：应用程序主动向内核查询是否有可用数据，如果有自己负责把数据从内核copy到用户空间。
异步IO：应用程序向内核发起读数据请求需要：（1）告诉内核数据存放位置（2）注册回调函数，当内核完成数据copy后调用回调通知应用程序取数据。
同步/异步最大区别：数据从内核空间到用户空间的copy动作由应用程序自己完成。而异步IO则是注册回调函数并告知内核用户空间缓冲区存放地址，数据copy由内核完成。

下面以read操作为例简单介绍每种IO处理流程。

阻塞IO模型

图1 阻塞IO模型时序图

这种模型特点如其名，没有可用数据时read操作会被阻塞，用户线程也会阻塞在这个read操作上。这种模型对一些高速IO设备或者对于吞吐量要求高的场景比较合适。为最大限度发挥这种模型优势，需要提高每个线程处理效率，线程会长时间处于组塞状态会降低系统资源利用率。对于需要监听大量文件句柄，且每个句柄读写操作不频繁的场景，这种IO模型。不适合。比如：web聊天程序，需要保持大量长连接，但是每个连接产生数据的速度很慢。在此场景下一个线程对应一个连接，线程busy时间较少，系统利用率低，系统资源被大量浪费（文件句柄、连接句柄、线程占用的内存等宝贵资源）。这种场景多路复用IO非常合适。

非阻塞IO模型

图2 非阻塞IO模型时序图

这种IO模型和阻塞IO不同。在无数据可读时，read操作并不会被阻塞，而是返回一个错误码。应用程序取到这个错误码后可知当前并无数据可用，从而进行其它逻辑处理（可以继续尝试读取数据，也可以做其它事情）。这种IO模型在处理web聊天程序场景的效率会比阻塞IO模型好点，至少不会被阻塞住，这样可以遍历所有套接字句柄，直到找到一个有数据可读套接字，然后为这个连接服务。但这也有一个明显的缺点：用户需要多次调用read操作然后根据返回值判断当前句柄是否有数据可读，多次无用循环浪费了cpu而且无用 read调用也使程序运行效率下降。