epoll的原理

青草地溪水旁

已于 2025-02-16 09:59:31 修改

阅读量883

点赞数 7

分类专栏： linux 文章标签： linux 多路复用

于 2025-02-13 23:33:35 首次发布

本文链接：https://blog.csdn.net/weixin_42108533/article/details/145622680

版权

56 篇文章

订阅专栏

Epoll是Linux系统中高效的I/O多路复用机制，广泛应用于高并发服务器（如Nginx、Redis）。其核心原理在于事件驱动模型和高效数据结构设计，解决了传统select/poll的性能瓶颈。以下从数据结构、工作流程、触发模式等维度展开分析：

Epoll通过三个关键系统调用实现事件管理：

epoll_create
创建eventpoll内核对象，包含红黑树（存储所有监听的fd）和就绪链表（存储活跃事件）。该对象通过文件描述符（epfd）返回给用户[3][6] 。
epoll_ctl
管理红黑树中的fd，支持添加（EPOLL_CTL_ADD）、修改（EPOLL_CTL_MOD）、删除（EPOLL_CTL_DEL）事件。每个socket与回调函数ep_poll_callback绑定，当事件发生时，内核将事件插入就绪链表[3][6] 。
epoll_wait
检查就绪链表，若有事件则直接返回给用户态，时间复杂度为O(1)。若链表为空，则阻塞等待超时或新事件[3][5] 。

回调函数（ep_poll_callback）
当socket发生数据到达、连接关闭等事件时，内核触发回调，将对应事件添加到就绪链表。此过程通过中断机制实现：网卡接收数据后通过DMA写入内存，并向CPU发送中断信号，操作系统调用中断处理程序唤醒等待进程[1][2] 。
进程阻塞与唤醒
- 调用recv时，进程从运行态转为阻塞态，被移入socket的等待队列。
- 数据到达后，内核将进程重新加入工作队列，等待CPU调度[1][2] 。

水平触发（LT，默认）
- 只要socket缓冲区有未读数据，epoll_wait会持续通知。
- 编程更简单，但可能重复触发，适合对实时性要求不高的场景[3][4] 。
边缘触发（ET）
- 仅在socket状态变化时通知一次（如从无数据到有数据）。
- 需配合非阻塞IO循环读取直到EAGAIN，否则可能丢失后续事件。
- 减少无效事件通知，适合高并发场景[3][9] 。