1.1、I/O基础入门
- 没有数据缓冲区,I/O性能存在问题
- 没有C或者C++中的Channel概念,只有输入和输出流
- 同步阻塞式I/O通信(BIO),通常会导致通信现成被长时间阻塞
- 支持的字符集有限,硬件可移植性不好
1.1.1、Linux模型I/O模型简介
Linux的内核将所有外部设备都看做一个文件来操作,对一个文件的读写操作会调用内核提供的系统命令,返回一个file descriptor(fd,文件描述符)。
根据UNIX网络编程对I/O模型的分类,UNIX提供了5中I/O模型,分别如下:
- 阻塞I/O模型
最常用的I/O模型就是阻塞I/O模型
- 非阻塞I/O模型非阻塞I/O模型
- I/O复用模型
Linux提供select/poll,进程通过将一个或者多个fd传递给select或poll系统调用,阻塞在select操作上,这样select/poll可以帮我们侦测多个fd是否处于就绪系统。select/poll是顺序扫描fd是否就绪,而且支持的fd数量有限,因此它的使用受到了一些制约。
Linxu提供了epoll系统调用,epoll使用基于事件驱动方式代替顺顺扫描,因此性能更高。当有fd就绪时,立即回调函数rollback
- 信号驱动模型
- 异步I/O
告知内核启动某个操作,并让内核在整个操作完成后通知我们
- 异步I/O和信号驱动的区别
- 信号驱动I/O由内核通知我们何时开始一个I/O操作
- 异步I/O模型由内核通知我们I/O操作何时已经完成
1.1.2、I/O多路复用技术
I/O多路复用技术通过把多个I/O的阻塞复用通一个select的阻塞上,从而使得系统在单线程的情况下可以同时处理多个客户端请求。
I/O多路复用的主要应用场景如下:
- 服务器需要同时处理多个处于监听状态或者多个连接状态的套接字
- 服务器需要同时处理多种网络协议的套接字
目前支持I/O多路复用的系统调用有 select、pselect、poll、epoll
为了克服select的缺点,epoll与select的原理比较类似,为了克服select缺点,epoll作为了很多重大改进,现总结如下。
- 支持一个进程打开的socket描述符(FD)不受限制(仅受限于操作系统的最大文件句柄数)。
- I/O效率不会随着FD数目的增加而线性下降。
- 使用mmap加速内核与用户空间的消息传递
- epoll的API更加简单。