一、概念
IO多路复用是一种同步机制,通过复用机制实现一个线程监视多个文件句柄,一旦某个文件句柄准备就续,就通知应用程序对文件读写操作。若没有文件句柄就续时会阻塞应用程序,交出cpu。多路是指网络连接,复用指的是同一个线程。
二、非多路IO处理方式
1、同步阻塞(BIO)
1.1单线程服务端概念
服务端采用单线程,在accpet一个请求之后,在recv或send调用阻塞时,将无法accept其它请求,(必须等上一个请求处recv或send完),无法并发执行任务。
1.2代码逻辑
// 伪代码描述
while(1) {
// accept阻塞
client_fd = accept(listen_fd)
fds.append(client_fd)
for (fd in fds) {
// recv阻塞(会影响上面的accept)
if (recv(fd)) {
// logic
}
}
}
1.3多线程服务端概念
当accept一个请求后,开启线程执行recv或send,多线程情况下可以并发,但是多线程同时运行会使用大量空间,消耗大量资源,10000个线程真正发生读写事件的线程数不会超过20%,造成了资源浪费。
1.3 代码逻辑
// 伪代码描述
while(1) {
// accept阻塞
client_fd = accept(listen_fd)
// 开启线程read数据(fd增多导致线程数增多)
new Thread func() {
// recv阻塞(多线程不影响上面的accept)
if (recv(fd)) {
// logic
}
}
}
2、同步非阻塞(NIO)
2.1概念
在服务端accept一个请求后,将fd加入fds集合,每次轮询一遍fds中recv(非阻塞)数据,没有数据则立即返回错误,每次轮询所有fd(包括没有发生读写事件的fd),会造成资源浪费。
2.2代码逻辑
setNonblocking(listen_fd)
// 伪代码描述
while(1) {
// accept非阻塞(cpu一直忙轮询)
client_fd = accept(listen_fd)
if (client_fd != null) {
// 有人连接
fds.append(client_fd)
} else {
// 无人连接
}
for (fd in fds) {
// recv非阻塞
setNonblocking(client_fd)
// recv 为非阻塞命令
if (len = recv(fd) && len > 0) {
// 有读写数据
// logic
} else {
无读写数据
}
}
}
三、IO多路复用机制
1.概念
IO多路复用机制都是IO(读缓冲区和写缓冲区)同步机制,通过内核的监听事件,监视多个文件描述符,一旦某个文件发过来,读缓冲区就会有变化,内核就监听到了,就通知程序对文件读写。selcet函数是一个轮循函数,即当循环询问文件节点,可设置超时时间,超时时间到了就跳过代码继续往下执行。
2.select
2.1概念
select时间复杂度O(n),它仅仅知道有I/O事件发生了,但是不知道具体是哪几个流,所以只能无差别轮询,找到能读出的数据,或者写入数据的流,以便对它们操作。所以当流越多,越需要时间。
2.2函数原型
int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);
参数:
1.int maxfdp集合中所有文件描述符最大值+1,在windows中这个参数不重要,设置出错也没问题。
2.struct fd_set 存放文件描述符的集合,即文件句柄。fd_set集合可以通过一些宏由人为来操作。
宏:
FD_ZERO(fd_set *fdset) 清空fdset与所有文件句柄的联系。
FD_SET(int fd, fd_set *fdset) 建立文件句柄fd与fdset的联系。
FD_CLR(int fd, fd_set *fdset):清除文件句柄fd与fdset的联系。
FD_ISSET(int fd, fdset *fdset):检查fdset联系的文件句柄fd是否可读写,>0表示可读写。
3.struct timeval 有3种情况。第一:传参为NULL,即不传入时间结构,表示select阻塞,一定要等到监视文件描述符集合中某个文件描述符发生变化为止。第二:传参为0秒0毫秒,让select变成非阻塞函数,不管文件描述符是否变化,都会返回继续执行,文件无变化返回0,有变化返回正值。第三:timeout的值大于0,这就是等待的超时时间,即select在timeout时间内阻塞,超时时间之内有事件到来就返回了,否则在超时后不管怎样一定返回。
struct timeval{
long tv_sec; //秒
long tv_usec; //毫秒
};
4.三个fd_set分别监视文件描述符的读写异常变化,如果有select会返回一个大于0的值。如果没有则在timeout的时间后select返回0,若发生错误返回负值。可以传入NULL值,表示不关心任何文件的读/写/异常变化。
2.3 select机制
解select模型的关键在于理解fd_set,为说明方便,取fd_set长度为1字节,fd_set中的每一bit可以对应一个文件描述符fd。则1字节长的fd_set最大可以对应8个fd。
(1)执行fd_set set; FD_ZERO(&set);则set用位表示是0000,0000。
(2)若fd=5,执行FD_SET(fd,&set);后set变为0001,0000(第5位置为1)
(3)若再加入fd=2,fd=1,则set变为0001,0011
(4)执行select(6,&set,0,0,0)阻塞等待
(5)若fd=1,fd=2上都发生可读事件,则select返回,此时set变为0000,0011。注意:没有事件发生的fd=5被清空。
所以,我们可以得到select模型的特点:
(1) 文件描述符个数有限,一般来说这个数目和系统内存关系很大。select使用位域的方式来传递关心的文件描述符,位域就有最大长度。select使用位域的方式传回就绪的文件描述符,调用者需要循环遍历每一个位判断是否就绪,当文件描述符个数很多,但是空闲的文件描述符大大多于就绪的文件描述符的时候,效率很低。
(2) 将fd加入select监控集的同时,还要再使用一个数据结构array保存放到select监控集中的fd,一是用于再select 返回后,array作为源数据和fd_set进行FD_ISSET判断。二是select返回后会把以前加入的但并无事件发生的fd清空,则每次开始 select前都要重新从array取得fd逐一加入(FD_ZERO最先),扫描array的同时取得fd最大值maxfd,用于select的第一个 参数。
(3) 可见select模型必须在select前循环array(加fd,取maxfd),select返回后循环array(FD_ISSET判断是否有时间发生)。
3.poll
3.1 API
#include <poll.h>
int poll(struct pollfd *fds, nfds_t nfds, int timeout);
功能:监听多个文件描述符的属性变化
参数:
fds:指向struct pollfd的结构体的第0个值的指针。
struct pollfd{
int fd; //套接字
short events; //等待的事件
short revents; //实际发生的事件
};
nfds:指定第一个参数中结构体的个数
timeout:设定时间限制,超时后不管是否还有文件句柄改变函数都要返回
3.2 优点
1.不像select,只有1024个文件描述符的限制,poll没有文件描述符限制。
2.将输入输出参数进行分离,不用每次设定。
4.epoll
4.1 API
#include <sys/epoll.h>
创建红黑树:
int epoll_create(int size);
参数:
size : 监听的文件描述符的上限, 2.6版本之后写1即可,
返回: 返回树的句柄
上树、下树、修改节点:
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
参数:
epfd : 树的句柄
op : EPOLL_CTL_ADD 上树 EPOLL_CTL_DEL 下树 EPOLL_CTL_MOD 修改
fd : 上树,下树的文件描述符
event : 上树的节点
typedef union epoll_data {
void *ptr;
int fd;
uint32_t u32;
uint64_t u64;
} epoll_data_t;
struct epoll_event {
uint32_t events; /* Epoll events */ 需要监听的事件
epoll_data_t data; /* User data variable */ 需要监听的文件描述符
};
事件包括:EPOLLIN、EPOLLOUT、EPOLLRDHUP、EPOLLERR
监听:
int epoll_wait(int epfd, struct epoll_event *events,
int maxevents, int timeout);
功能: 监听树上文件描述符的变化
epfd : 数的句柄
events : 接收变化的节点的数组的首地址
maxevents : 数组元素的个数
timeout : -1 永久监听 大于等于0 限时等待
返回值: 返回的是变化的文件描述符个数
epoll_ctl(epfd, EPOLL_CTL_ADD,cfd, &ev);
4.2 epoll原理
利用红黑树的方式监听文件描述符的变化。
4.3 epoll两种工作方式
边沿触发和水平触发。