网络编程模型

该篇文章是当时参加培训班时我们老师给的资料,觉得写得非常浅显易懂,在这里分享给大家。

术语概念描述:
IO有内存IO、网络IO和磁盘IO三种,通常我们说的IO指的是后两者。
阻塞和非阻塞,是函数/方法的实现方式,即在数据就绪之前是立刻返回还是等待。
以文件IO为例,一个IO读过程是文件数据从磁盘→内核缓冲区→用户内存的过程。同步与异步的区别主要在于数据从内核缓冲区→用户内存这个过程需不需要用户进程等待。有个数据拷贝的过程,是拷贝完再通知还是在内核缓冲区就通知。(网络IO把磁盘换做网卡即可)
Linux IO模型

  1. 同步阻塞
  2. 同步非阻塞
  3. IO复用
  4. 信号驱动
  5. 异步非阻塞
    同步阻塞
    去餐馆吃饭,点一个自己最爱吃的盖浇饭,然后在原地等着一直到盖浇饭做好,自己端到餐桌就餐。这就是典型的同步阻塞。当厨师给你做饭的时候,你需要一直在那里等着。
    网络编程中,读取客户端的数据需要调用recvfrom。在默认情况下,这个调用会一直阻塞直到数据接收完毕,就是一个同步阻塞的IO方式。这也是最简单的IO模型,在通常fd(文件描述句柄)较少、就绪很快的情况下使用是没有问题的。
    在这里插入图片描述
    同步非阻塞
    你每次点完饭就在那里等着,突然有一天你发现自己真傻。于是,你点完之后,就回桌子那里坐着,然后估计差不多了,就问老板饭好了没,如果好了就去端,没好的话就等一会再去问,依次循环直到饭做好。这就是同步非阻塞。
    这种方式在编程中对socket设置O_NONBLOCK即可。但此方式仅仅针对网络IO有效,对磁盘IO并没有作用。因为本地文件IO就没有被认为是阻塞,我们所说的网络IO的阻塞是因为网路IO有无限阻塞的可能,而本地文件除非是被锁住,否则是不可能无限阻塞的,因此只有锁这种情况下,O_NONBLOCK才会有作用。而且,磁盘IO时要么数据在内核缓冲区中直接可以返回,要么需要调用物理设备去读取,这时候进程的其他工作都需要等待。因此,后续的IO复用和信号驱动IO对文件IO也是没有意义的。
    在这里插入图片描述
    IO复用
    你点一份饭然后循环的去问好没好显然有点得不偿失,还不如就等在那里直到准备好,但是当你点了好几样饭菜的时候,你每次都去问一下所有饭菜的状态(未做好/已做好)肯定比你每次阻塞在那里等着好多了。当然,你问的时候是需要阻塞的,一直到有准备好的饭菜或者你等的不耐烦(超时)。这就引出了IO复用,也叫多路IO就绪通知。这是一种进程预先告知内核的能力,让内核发现进程指定的一个或多个IO条件就绪了,就通知进程。使得一个进程能在一连串的事件上等待。
    IO复用的实现方式目前主要有select、poll和epoll。
    select和poll的原理基本相同:
    ● 注册待侦听的fd(这里的fd创建时最好使用非阻塞)
    ● 每次调用都去检查这些fd的状态,当有一个或者多个fd就绪的时候返回
    ● 返回结果中包括已就绪和未就绪的fd
    相比select,poll解决了单个进程能够打开的文件描述符数量有限制这个问题:select受限于FD_SIZE的限制,如果修改则需要修改这个宏重新编译内核;而poll通过一个pollfd数组向内核传递需要关注的事件,避开了文件描述符数量限制。此外,select和poll共同具有的一个很大的缺点就是包含大量fd的数组被整体复制于用户态和内核态地址空间之间,开销会随着fd数量增多而线性增大。
    select和poll就类似于上面说的就餐方式。但当你每次都去询问时,老板会把所有你点的饭菜都轮询一遍再告诉你情况,当大量饭菜很长时间都不能准备好的情况下是很低效的。于是,老板有些不耐烦了,就让厨师每做好一个菜就记下来他。这样每次你再去问的时候,他会直接把已经准备好的菜告诉你,你再去端。这就是事件驱动IO就绪通知的方式epoll。
    epoll的出现,解决了select、poll的缺点:
    ● 基于事件驱动的方式,避免了每次都要把所有fd都扫描一遍。
    ● epoll_wait只返回就绪的fd。
    ● epoll使用nmap内存映射技术避免了内存复制的开销。
    ● epoll的fd数量上限是操作系统的最大文件句柄数目,这个数目一般和内存有关,通常远大于1024。
    总结:
  6. select:支持注册 FD_SETSIZE(1024) 个 socket。
  7. poll: poll 作为 select 的替代者,最大的区别就是,poll 不再限制 socket 数量。
  8. epoll:epoll 能直接返回具体的准备好的通道,时间复杂度 O(1)。
    ps:select 和 poll 都有一个共同的问题,那就是它们都只会返回所有通道(channel),但是不会告诉你具体是哪几个通道已经就绪。一旦知道有通道准备好以后,需要进行一次扫描,通道少的时候还行,一旦通道的数量是几十万个以上的时候,扫描一次的时间复杂度 O(n)。后来才催生了epoll实现。

此外,对于IO复用还有一个水平触发和边缘触发的概念:
● 水平触发:当就绪的fd未被用户进程处理后,下一次查询依旧会返回,这是select和poll的触发方式。
● 边缘触发:无论就绪的fd是否被处理,下一次不再返回。理论上性能更高,但是实现相当复杂,并且任何意外的丢失事件都会造成请求处理错误。epoll默认使用水平触发,通过相应选项可以使用边缘触发。
在这里插入图片描述
信号驱动
上文的就餐方式还是需要你每次都去问一下饭菜状况。于是,你再次不耐烦了,就跟老板说,哪个饭菜好了就通知我一声吧。然后就自己坐在桌子那里干自己的事情。更甚者,你可以把手机号留给老板,自己出门,等饭菜好了直接发条短信给你。这就类似信号驱动的IO模型。
流程如下:
● 开启套接字信号驱动IO功能
● 系统调用sigaction执行信号处理函数(非阻塞,立刻返回)
● 数据就绪(在内核缓冲区),生成sigio信号,通过信号回调通知应用来读取数据。
在这里插入图片描述
异步非阻塞
之前的就餐方式,到最后总是需要你自己去把饭菜端到餐桌。这下你也不耐烦了,于是就告诉老板,能不能饭好了直接端到你的面前或者送到你的家里(数据在用户内存就绪)。这就是异步非阻塞IO了。
对比信号驱动IO,异步IO的主要区别在于:信号驱动由内核告诉我们何时可以开始一个IO操作(数据在内核缓冲区中),而异步IO则由内核通知IO操作何时已经完成(数据已经在用户空间中)。异步IO又叫做事件驱动IO,在Unix中,POSIX1003.1标准为异步方式访问文件定义了一套库函数,定义了AIO的一系列接口。使用aio_read或者aio_write发起异步IO操作。使用aio_error检查正在运行的IO操作的状态。
在这里插入图片描述

  • 49
    点赞
  • 168
    收藏
    觉得还不错? 一键收藏
  • 8
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值