前4个为同步,后面一个为异步
阻塞I/O
IO复用模型
非阻塞IO模型(了解即可)
非阻塞IO通过进程反复调用IO函数(多次系统调用, 并马上返回) ; 在数据拷贝的过程中, 进程是阻塞的
信号驱动IO (了解即可)
套接口进行信号驱动I/O,并安装一个信号处理函数, 进程继续运行并不阻塞。
当数据准备好时, 进程会收到一个SIGIO信号, 可以在信号处理函数中调用I/O操作函数处理数据。
异步IO模型(了解即可)
当一个异步过程调用发出后, 调用者不能立刻得到结果。
实际处理这个调用的部件在完成后, 通过状态、 通知和回调来通知调用者的输入输出操作。
epoll高效原理和底层机制分析
进程阻塞。调用recv后会把进程a放入其他进程中处理。进程a阻塞,不会往下执行代码, 也不会占用 cpu 资源。当 socket 接收到数据后, 操作系统将该 socket 等待队列上的进程重新放回
到工作队列,recv 就可以返回接收到的数据。
内核接收网络数据全过程
进程在 recv 阻塞期间, 计算机收到了对端传送的数据(步骤①) 。 数据经
由网卡传送到内存(步骤②) , 然后网卡通过中断信号通知 cpu 有数据到达, cpu
执行中断程序(步骤③) 。 此处的中断程序主要有两项功能, 先将网络数据写入
到对应 socket 的接收缓冲区里面(步骤④) , 再唤醒进程 A(步骤⑤) , 重新将
进程 A 放入工作队列中。为了提高处理速度, 操作系统会维护端口号到 socket 的索引结构, 以快速读取
select 的用法
int fds[] = 存放需要监听的 socket
while(1){
int n = select(..., fds, ...)
for(int i=0; i < fds.count; i++){
if(FD_ISSET(fds[i], ...)){
//fds[i]的数据处理
}}}
其一, 每次调用 select 都需要将进程加入到所有被监视 socket 的等待队列,每次唤醒都需要从每个队列中移除, 都必须要进行遍历。 而且每次都要将整个 fds列表传递给内核, 有一定的开销。 正是因为遍历操作开销大, 出于效率的考量,才会规定 select 的最大监视数量, 默认只能监视 1024 个 socket。
其二, 进程被唤醒后, 程序并不知道哪些 socket 收到数据, 还需要遍历一次。
epoll 的设计思路
措施一: 功能分离
select 低效的原因之一是将“维护等待队列” 和“阻塞进程” 两个步骤合二为一。 每次调用 select 都需要这两步操作, 然而大多数应用场景中, 需要监视的socket 相对固定, 并不需要每次都修改。 epoll 将这两个操作分开, 先用 epoll_ctl维护等待队列, 再调用 epoll_wait 阻塞进程。 显而易见的, 效率就能得到提升。
相比 select, epoll 拆分了功能
int epfd = epoll_create(...);
epoll_ctl(epfd, ...); //将所有需要监听的 socket 添加到 epfd 中
while(1){
int n = epoll_wait(...)
for(接收到数据的 socket){
//处理
}}
措施二: 就绪列表
select 低效的另一个原因在于程序不知道哪些 socket 收到数据, 只能一个个遍历。 如果内核维护一个“就绪列表” , 引用收到数据的 socket, 就能避免遍历。
epoll 的原理和流程
当某个进程调用 epoll_create 方法时, 内核会创建一个 eventpoll 对象(也就是程序中 epfd 所代表的对象) 。 eventpoll 对象也是文件系统中的一员, 和 socket一样, 它也会有等待队列。
创建 epoll 对象后, 可以用 epoll_ctl 添加或删除所要监听的 socket。 以添加socket 为例, 如下图, 如果通过 epoll_ctl 添加 sock1、 sock2 和 sock3 的监视, 内核会将 eventpoll 添加到这三个 socket 的等待队列中。
当 socket 收到数据后, 中断程序会操作 eventpoll 对象, 而不是直接操作进程。 中断程序会给 eventpoll 的“就绪列表” 添加 socket 引用。 如下图展示的是sock2 和 sock3 收到数据后, 中断程序让 rdlist 引用这两个 socket。
eventpoll 对象相当于是 socket 和进程之间的中介, socket 的数据接收并不直接影响进程, 而是通过改变 eventpoll 的就绪列表来改变进程状态。
当程序执行到 epoll_wait 时, 如果 rdlist 已经引用了 socket, 那么 epoll_wait直接返回, 如果 rdlist 为空, 阻塞进程。
假设计算机中正在运行进程 A 和进程 B, 在某时刻进程 A 运行到了 epoll_wait语句。 如下图所示, 内核会将进程 A 放入 eventpoll 的等待队列中, 阻塞进程。
当 socket 接收到数据, 中断程序一方面修改 rdlist, 另一方面唤醒 eventpoll等待队列中的进程, 进程 A 再次进入运行状态。 也因为 rdlist 的存在, 进程 A 可以知道哪些 socket 发生了变化。
红黑树是一种自平衡二叉查找树, 搜索、 插入和删除时间复杂度都是O(log(N)), 效率较好。 epoll 使用了红黑树作为索引结构维护socket列表。rdlist双向链表。