一、前言
上篇Handler源码分析说到为什么looper死循环不会导致主线程ANR,原因就在于Android系统是一个以事件作为驱动的系统,当没有事件时界面就应该处于静态状态,深层的原因就是Handler在调用message.next()
时也调用了nativePollOnce()方法用于等待下一条消息到达。然后在添加消息到队列时,也会调用native static void nativeWake(long)
唤醒线程继续处理消息。
上述所说的阻塞和唤醒都发生在native代码中。native 会使用epoll来进行操作。
二、epoll介绍
Epoll是linux2.6内核的一个新的系统调用,Epoll在设计之初,就是为了替代select,Epoll线性复杂度的模型,epoll的时间复杂度为O(1), 也就意味着,Epoll在高并发场景,随着文件描述符的增长,有良好的可扩展性。与select和poll的区别是它们监听文件描述符列表时,采用的是线性查找,时间复杂度是O(n),而epoll采用内核文件级别的回调机制,时间复杂度是O(1)。
epoll的核心是三个API,所采用的数据结构是红黑树和链表。
1.epoll_create
创建epoll句柄
函数声明:int epoll_create(int size)
参数:size用来告诉内核这个监听的数目一共有多大。
返回值:返回创建了的epoll句柄。
当创建好epoll句柄后,它就是会占用一个fd值,在linux下如果查看/proc/进程id/fd/,是能够看到这个fd的,所以在使用完epoll后,必须调用close()关闭,否则可能导致fd被耗尽。
2.epoll_ctl
将被监听的描述符添加到epoll句柄或从epool句柄中删除或者对监听事件进行修改。
函数申明:int epoll_ctl(int epfd, int op, int fd, struct epoll_event*event);
参数:
epfd: epoll_create()的返回值
op:表示要进行的操作,其值分别为:
EPOLL_CTL_ADD: 注册新的fd到epfd中;
EPOLL_CTL_MOD: 修改已经注册的fd的监听事件;
EPOLL_CTL_DEL: 从epfd中删除一个fd;
fd:需要操作/监听的文件句柄
event:是告诉内核需要监听什么事件,struct epoll_event如下:
typedef union epoll_data {
void *ptr;
int fd;
__uint32_t u32;
__uint64_t u64;
} epoll_data_t;
struct epoll_event {
__uint32_t events; /* Epoll events */
epoll_data_t data; /* User data variable */
};
events可以是以下几个宏的集合:
EPOLLIN:触发该事件,表示对应的文件描述符上有可读数据。(包括对端SOCKET正常关闭);
EPOLLOUT:触发该事件,表示对应的文件描述符上可以写数据;
EPOLLPRI:表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来);
EPOLLERR:表示对应的文件描述符发生错误;
EPOLLHUP: 表示对应的文件描述符被挂断;
EPOLLET:将EPOLL设为边缘触发(EdgeTriggered)模式,这是相对于水平触发(Level Triggered)来说的。
EPOLLONESHOT: 只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列里。
示例:
struct epoll_event ev;
//设置与要处理的事件相关的文件描述符
ev.data.fd=listenfd;
//设置要处理的事件类型
ev.events=EPOLLIN|EPOLLET;
//注册epoll事件
epoll_ctl(epfd,EPOLL_CTL_ADD,listenfd,&ev);
3.epoll_wait
等侍注册在epfd上的socket fd的事件的发生,如果发生则将发生的sokct fd和事件类型放入到events数组中。
函数原型:int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
参数:
epfd:由epoll_create 生成的epoll文件描述符
events:用于回传代处理事件的数组
maxevents:每次能处理的最大事件数
timeout:等待I/O事件发生的超时毫秒数,-1相当于阻塞,0相当于非阻塞。一般用-1即可
那么epoll是如何工作的呢?
当某一进程调用epoll_create方法时,Linux内核会创建一个eventpoll结构体,这个结构体中有两个成员与epoll的使用方式密切相关。eventpoll结构体如下所示:
struct eventpoll{
....
/*红黑树的根节点,这颗树中存储着所有添加到epoll中的需要监控的事件*/
struct rb_root rbr;
/*双链表中则存放着将要通过epoll_wait返回给用户的满足条件的事件*/
struct list_head rdlist;
....
};
每一个epoll对象都有一个独立的eventpoll结构体,用于存放通过epoll_ctl方法向epoll对象中添加进来的事件。这些事件都会挂载在红黑树中,如此,重复添加的事件就可以通过红黑树而高效的识别出来(红黑树的插入时间效率是lgn,其中n为树的高度)。
而所有添加到epoll中的事件都会与设备(网卡)驱动程序建立回调关系,也就是说,当相应的事件发生时会调用这个回调方法。这个回调方法在内核中叫ep_poll_callback,它会将发生的事件添加到rdlist双链表中。
在epoll中,对于每一个事件,都会建立一个epitem结构体,如下所示:
struct epitem{
struct rb_node rbn;//红黑树节点
struct list_head rdllink;//双向链表节点
struct epoll_filefd ffd; //事件句柄信息
struct eventpoll *ep; //指向其所属的eventpoll对象
struct epoll_event event; //期待发生的事件类型
}
当调用epoll_wait检查是否有事件发生时,只需要检查eventpoll对象中的rdlist双链表中是否有epitem元素即可。如果rdlist不为空,则把发生的事件复制到用户态,同时将事件数量返回给用户。
三、Handler中的使用
handler只是简单的使用了epoll的阻塞和唤醒机制。nativePollOnce
在某个文件描述符上调用 epoll_wait
, 而 nativeWake
写入一个 IO 操作到描述符, epoll_wait
等待. 然后, 内核从等待状态中取出 epoll
等待线程, 并且该线程继续处理新消息。
看看源码就知道了。
nativeWake
void NativeMessageQueue::wake() {
mLooper->wake();
}
void Looper::wake() {
uint64_t inc = 1;
ssize_t nWrite = TEMP_FAILURE_RETRY(write(mWakeEventFd, &inc, sizeof(uint64_t)));
if (nWrite != sizeof(uint64_t)) {
if (errno != EAGAIN) {
LOG_ALWAYS_FATAL("Could not write wake signal to fd %d: %s",
mWakeEventFd, strerror(errno));
}
}
}
nativePollOnce
:
void NativeMessageQueue::pollOnce(JNIEnv* env, jobject pollObj, int timeoutMillis) {
mPollEnv = env;
mPollObj = pollObj;
mLooper->pollOnce(timeoutMillis);
mPollObj = NULL;
mPollEnv = NULL;
if (mExceptionObj) {
env->Throw(mExceptionObj);
env->DeleteLocalRef(mExceptionObj);
mExceptionObj = NULL;
}
}
int Looper::pollOnce(int timeoutMillis, int* outFd, int* outEvents, void** outData) {
//...省略部分代码
result = pollInner(timeoutMillis);
}
}
int Looper::pollInner(int timeoutMillis) {
//...省略部分代码
struct epoll_event eventItems[EPOLL_MAX_EVENTS];
// 这里重点 调用epoll_wait
int eventCount = epoll_wait(mEpollFd, eventItems, EPOLL_MAX_EVENTS, timeoutMillis);
//... 省略部分代码