1》 IO Block
OS主动预见这个Block会发生才会主动Block,例如TCP连接数据时,发现Socket Buffer中没有数据,则代表发送方还未发送数据,则此时可以Block
像从硬盘读取数据时,OS不知道什么时候会数据卡顿,所以就不会发生IO Block
2》BIO(同步阻塞)
- Blocking IO,类似于网络中进行
read
,write
,connect
一类的系统调用时会被卡住 - 单线程的网络服务,这样做就会有卡死的问题。因为当等待时,整个线程会被挂起,无法执行,也无法做其他的工作
- Block只会影响当前线程,不会影响其他线程
- 开发中,需要的是调用read函数读取数据时,读到数据就使用,没有数据就切换进程做其他事,不需要Block阻塞,于是NIO登场
3》 NIO(同步非阻塞)
-
在NIO模式下,调用read,如果发现没有数据已经到达,就会立刻返回-1, 并且errno被设为
EAGAIN
。 -
模拟代码:
struct timespec sleep_interval{.tv_sec = 0, .tv_nsec = 1000}; ssize_t nbytes; while (1) { /* 尝试读取 */ if ((nbytes = read(fd, buf, sizeof(buf))) < 0) { if (errno == EAGAIN) { // 没数据到 perror("nothing can be read"); } else { perror("fatal error"); exit(EXIT_FAILURE); } } else { // 有数据 process_data(buf, nbytes); } // 处理其他事情,做完了就等一会,再尝试 nanosleep(sleep_interval, NULL); }
-
NIO也会出现问题:
- 如果有大量文件描述符都要等,那么就得一个一个的read。这会带来大量的Context Switch
- 休息一会的时间不好把握,如果太长,程序响应的时间就会很长;如果太短,那么会导致频繁切换进程,造成CPU浪费
为了解决上面问题,IO多路复用登场
NIO实现原理:
NIO由三个核心部分组成:Channel、Buffer、Selector
- 所有的IO在NIO中都是从一个Channel开始,数据可以从Channel读到buffer,也可以从buffer中读到Channel
- buffer是一块可以读写数据的内存
- Selector允许单线程处理多个 Channel
Buffer包含三个重要属性:capacity、position、limit
- capacity:最大内存大小
- position:类似读写指针,指示当前读写的位置
- limit:写模式是下表示最多写入多少数据,此时limit==capacity;读模式下相当于position,指示当前读到的位置。关系如下图:
4》 AIO(异步非阻塞)
- AIO与NIO不同,读写操作只需要调用read、write方法即可,这两种方法均为异步,完成后会主动回调函数
- AIO是委托了OS对读写操作进行管理。当请求读时,OS会将要读的数据加载到read函数缓冲区,并通知应用读取数据;当请求写时,写入的数据会经OS缓冲区写入指定位置,写入完毕时也会通知应用程序
总结:
- 同步阻塞:用户进程发起一个IO请求后,就需要一直等待IO操作结束后其他进程才能运行。
- 如:自己去银行ATM机取钱并且需要排队
- 同步非阻塞:用户进程发起IO请求后就可以去做其他事了,不需要挂起等待,但需要时不时询问IO操作是否结束。
- 如:自己拿着VIP卡去银行前台取钱,不需要排队,取钱时玩会手机,但需要时不时看一眼柜台弄完没有。
- 异步非阻塞:用户进程发起IO请求后就可以去做其他事,且不需要询问,内核IO操作结束后会自动通知应用进程。
- 如:派一个小弟拿着VIP卡去取钱,取完钱后会给自己打电话说钱已经拿到了