Linux内核剖析-----IO复用函数epoll内核源码剖析

最新推荐文章于 2022-04-02 21:03:40 发布

Eunice_fan1207

最新推荐文章于 2022-04-02 21:03:40 发布

阅读量2.5k

点赞数 8

本文链接：https://blog.csdn.net/Eunice_fan1207/article/details/99674021

版权

本文详细介绍了Linux内核中epoll的实现，包括epoll_create、epoll_ctl和epoll_wait的工作原理。epoll通过红黑树和就绪链表优化了大并发下的文件描述符处理，避免了线性扫描的效率问题。epoll的优点包括支持大量FD、高效IO、回调机制和使用mmap减少拷贝。此外，文章讨论了边沿触发的适用场景及如何处理EPOLLONESHOT事件，以及epoll在高并发和多链接情况下的高效表现。

摘要由CSDN通过智能技术生成

本文参考董浩博客 http://donghao.org/uii/

epoll内核实现

（1）内核为epoll做准备工作

这个模块在内核初始化时（操作系统启动）注册了一个新的文件系统，叫"eventpollfs"（在eventpoll_fs_type结构里），然后挂载此文件系统。另外还创建两个内核cache（在内核编程中，如果需要频繁分配小块内存，应该创建kmem_cahe来做“内存池”）,分别用于存放struct epitem和eppoll_entry。这个内核高速cache区，就是建立连续的物理内存页，就是物理上分配好你想要的size的内存对象，每次使用时都是使用空闲的已分配好的内存。

现在想想epoll_create为什么会返回一个新的fd？

因为它就是在这个叫做"eventpollfs"的文件系统里创建了一个新文件！返回的就是这个文件的fd索引。完美地遵行了Linux一切皆文件的特色。

（2）epoll_create(int size)

epoll_ create时，内核除了帮我们在epoll文件系统里建了新的文件结点，将该节点返回给用户。还在内核cache里建立一个红黑树（实际上是每一个epoll对应的eventpoll）用于存储以后epoll_ctl传来的需要监听文件fd外，这些fd会以红黑树节点的形式保存在内核cache里，以便支持快速的查找、插入、删除操作。

（3）epoll_ctl

int epoll_ctl(int epfd, intop, int fd, struct epoll_event *event);

在这个实现时，将用户空间epoll_event拷贝到内核中，后续可以将其转化为epitem作为节点存入红黑树中，从eventpoll的红黑树中查找fd所对应的epitem实例（二分搜索），根据传入的op参数行为进行switch判断，对红黑树进行不同的操作。对于ep_insert，首先设置了对应的回调函数，然后调用被监控文件的poll方法（每个支持poll的设备驱动程序都要调用），其实就是在poll里调用了回调函数，这个回调函数实际上不是真正的回调函数，真正的回调函数(ep_poll_callback)在该函数内调用，这个回调函数只是创建了struct eppoll_entry，将真正回调函数和epitem关联起来，之后将其加入设备等待队列。当设备就绪，唤醒等待队列上的等待者，调用对应的真正的回调函数，这个

最低0.47元/天解锁文章

Eunice_fan1207

关注

8
点赞
踩
27

收藏

觉得还不错? 一键收藏
3
评论
Linux内核剖析-----IO复用函数epoll内核源码剖析

本文参考董浩博客http://donghao.org/uii/epoll内核实现（1）内核为epoll做准备工作这个模块在内核初始化时（操作系统启动）注册了一个新的文件系统，叫"eventpollfs"（在eventpoll_fs_type结构里），然后挂载此文件系统。另外还创建两个内核cache（在内核编程中，如果需要频繁分配小块内存，应该创建kmem_ca...
复制链接

扫一扫