1、阻塞到底是啥?
网络开发模型中,阻塞其实说的就是进程因为等待某个事件而主动让出CPU挂起的操作。在网络IO中,当进程等待Socket上的数据时,如果数据还没有到来,那就把当前进程状态从TASK_RUNNKNG修改为TASK_INTERRUPTIPLE,然后主动让出CPU。由调度器来调度下一个就绪状态的进程来执行。
所以在分析某个技术方案是不是阻塞的时候,关键要看进程有没有放弃CPU。如果放弃了,那就是阻塞。如果没放弃,那就是非阻塞。
2、同步阻塞IO需要哪些开销?
- 进程通过recv系统调用接受一个Socket上的数据时,如果数据没有到达,进程就被从CPU上拿下来,然后换上另一个进程。这导致一次进程上下文切换所产生的开销。
- 当连接上的数据就绪的时候,睡眠的进程又会被唤醒,又是一次进程切换产生的开销。
- 一个进程同时只能等待一条连接,如果由很多并发,则需要很多进程。每个进程都会占用几MB的内存。
总体上说,同步阻塞网络IO是高性能网络开发路上的绊脚石。
3、多路复用epoll为啥能提高网络性能
最根本原因:epoll极大程度地减少了无用的进程上下文切换,让进程更专注地处理网络请求。
- 在内核的硬、软中断上下文中,包从网卡接手过来进行处理,然后放到Socket的接收队列。再找到Socket关联的epitem,并把它添加到epoll对象的就序链表中。
- 在用户进程中,通过调用epoll_wait来查看就绪链表中是否有事件到达,如果有,直接取走进行处理。处理完毕再次调用epoll_wait