五种网络I/O模型

1.四种调节方式

在Linux下进行网络编程时,我们常常见到同步(Sync)/异步(Async),阻塞(Block)/非阻塞(Unblock)四种调用方式:

同步和异步的概念描述的是用户线程与内核的交互方式:同步是指用户线程发起IO请求后需要等待或者轮询内核IO操作完成 后才能继续执行;而异步是指用户线程发起IO请求后仍继续执行,当内核IO操作完成后会通知用户线程,或者调用用户线程注册 的回调函数。

阻塞和非阻塞的概念描述的是用户线程调用内核IO操作的方式:阻塞是指IO操作在没有接收完数据或者没有得到结果之前不 会返回,需要彻底完成后才返回到用户空间;而非阻塞是指IO操作被调用后立即返回给用户一个状态值,无需等到IO操作彻底完 成。

2.五种模型
  1. 同步阻塞IO(Blocking IO):即传统的IO模型,在linux中默认情况下所有的socket都是阻塞模式。当用户进程调用了 read()这个系统调用,内核就开始了IO的第一个阶段:准备数据。对于网络IO来说,很多时候数据在一开始还没有到达(比如, 还没有收到一个完整的UDP包),这个时候内核就要等待足够的数据到来。而在用户进程这边,整个进程会被阻塞。当内核一直 等到数据准备好了,它就会将数据从内核中拷贝到用户内存,然后内核返回结果,用户进程才解除阻塞的状态,重新运行起来; 几乎所有的程序员第一次接触到的网络编程都是从listen()、read()、write() 等接口开始的,这些接口都是阻塞型的,一个简单的 改进方案是在服务器端使用多线程(或多进程)。多线程(或多进程)的目的是让每个连接都拥有独立的线程(或进程),这样 任何一个连接的阻塞都不会影响其他的连接。
    图例:
    在这里插入图片描述

  2. 同步非阻塞IO(Non-blocking IO):默认创建的socket都是阻塞的,同步非阻塞IO是在同步阻塞IO的基础上,将socket 设置为NONBLOCK,这个可以使用ioctl()系统调用设置。这样做用户线程可以在发起IO请求后可以立即返回,如果该次读操作 并未读取到任何数据,用户线程需要不断地发起IO请求,直到数据到达后,才真正读取到数据,继续执行。整个IO请求的过程 中,虽然用户线程每次发起IO请求后可以立即返回,但是为了等到数据,仍需要不断地轮询、重复请求,消耗了大量的CPU的资 源。一般很少直接使用这种模型,而是在其他IO模型中使用非阻塞IO这一特性。
    图例:
    在这里插入图片描述

  3. IO多路复用(IO Multiplexing):IO多路复用模型是建立在内核提供的多路分离函数select基础之上的,使用select函数 可以避免同步非阻塞IO模型中轮询等待的问题,此外poll、epoll都是这种模型。在该种模式下,用户首先将需要进行IO操作的 socket添加到select中,然后阻塞等待select系统调用返回。当数据到达时,socket被激活,select函数返回。用户线程正式发起 read请求,读取数据并继续执行。从流程上来看,使用select函数进行IO请求和同步阻塞模型没有太大的区别,甚至还多了添加 监视socket,以及调用select函数的额外操作,效率更差。但是,使用select以后最大的优势是用户可以在一个线程内同时处理 多个socket的IO请求。用户可以注册多个socket,然后不断地调用select读取被激活的socket,即可达到在同一个线程内同时处 理多个IO请求的目的。而在同步阻塞模型中,必须通过多线程的方式才能达到这个目的。

图例:
在这里插入图片描述

  1. 信号驱动IO(signal driven IO):调用sigaltion系统调用,当内核中IO数据就绪时以SIGIO信号通知请求进程,请求进程 再把数据从内核读入到用户空间,这一步是阻塞的。
  2. 异步IO(Asynchronous IO):即经典的Proactor设计模式,也称为异步非阻塞IO。“真正”的异步IO需要操作系统更强 的支持。在IO多路复用模型中,事件循环将文件句柄的状态事件通知给用户线程,由用户线程自行读取数据、处理数据。而在异 步IO模型中,当用户线程收到通知时,数据已经被内核读取完毕,并放在了用户线程指定的缓冲区内,内核在IO完成后通知用户 线程直接使用即可。
3.五种方式的对比

相比于IO多路复用模型,信号驱动IO和异步IO并不十分常用,不少高性能并发服务程序使用IO多路复用模型+多线程任务处理 的架构基本可以满足需求。况且目前操作系统对异步IO的支持并非特别完善,更多的是采用IO多路复用模型模拟异步IO的方式。 在这里我们把前三种做一个形象地类比:

  1. 阻塞IO, 给客户端发一条信息, 然后就默默的一直等着客户端回信, 这个期间除了等待你不会做其他事情;
  2. 非阻塞IO, 给客户端发信息, 如果不回, 接着再发, 一直发到客户端回消息, 这个期间你除了发信息等待不会做其他事情;
  3. IO多路复用, 是设置一个“监视器”来帮你监视所有客户端回复的信息, 这个期间你可以些其他的事情。IO复用又包括 select, poll, epoll 模式. 那么它们的区别是什么?
  • select“监视器” 每一个客户端回复消息, select“监视器”都不知道这个是不是你对应的客户端回复的消息, 她需要一个一个询问, 并且select“监视器”能力还有 限, 最多一次帮你监视1024个客户端;
  • poll“监视器” 不限制监视客户端的数量, 只要是客户端回复的消息, 都会去查询是不是你对应的客户端回复的消息;
  • epoll“监视器” 不限制监视客户端的数量, 并且也不需要一个一个去查询. 那么如何做呢? epoll“监视器”会为每个客户端做一个不一样的“标记”,只有你对应的客户端回消息了,看到“标记”, epoll“监视器”就知道这个是不是你对应的客户端了, 然后“监视器”再通知你;

相比于其他的IO模型,多路复用是最高效和最实用的,其中的epoll也是相比最好用的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值