【Nginx】事件驱动框架处理流程

16 篇文章 4 订阅
ngx_event_core_module模块的ngx_event_process_init方法对事件模块做了一些初始化。其中包括将“请求连接”这样一个读事件对应的处理方法(handler)设置为ngx_event_accept函数,并将此事件添加到epoll模块中。当有新连接事件发生时,ngx_event_accept就会被调用。大致流程是这样:
  1. worker进程在ngx_worker_process_cycle方法中不断循环调用ngx_process_events_and_timers函数处理事件,这个函数是事件处理的总入口。
  2. ngx_process_events_and_timers会调用ngx_process_events,这是一个宏,相当于ngx_event_actions.process_events,ngx_event_actions是个全局的结构体,存储了对应事件驱动模块(这里是epoll模块)的10个函数接口。所以这里就是调用了ngx_epoll_module_ctx.actions.process_events函数,也就是ngx_epoll_process_events函数来处理事件。
  3. ngx_epoll_process_events调用Linux函数接口epoll_wait获得“有新连接”这个事件,然后调用这个事件的handler处理函数来对这个事件进行处理。
  4. 在上面已经说过handler已经被设置成了ngx_event_accept函数,所以就调用ngx_event_accept进行实际的处理。

下面分析ngx_event_accept方法,它的流程图如下所示:


经过精简的代码如下,注释中的序号对应上图的序号:
void
ngx_event_accept(ngx_event_t *ev)
{
    socklen_t          socklen;
    ngx_err_t          err;
    ngx_log_t         *log;
    ngx_uint_t         level;
    ngx_socket_t       s;
    ngx_event_t       *rev, *wev;
    ngx_listening_t   *ls;
    ngx_connection_t  *c, *lc;
    ngx_event_conf_t  *ecf;
    u_char             sa[NGX_SOCKADDRLEN];
 
    if (ev->timedout) {
        if (ngx_enable_accept_events((ngx_cycle_t *) ngx_cycle) != NGX_OK) {
            return;
        }
 
        ev->timedout = 0;
    }
 
    ecf = ngx_event_get_conf(ngx_cycle->conf_ctx, ngx_event_core_module);
 
    if (ngx_event_flags & NGX_USE_RTSIG_EVENT) {
        ev->available = 1;
 
    } else if (!(ngx_event_flags & NGX_USE_KQUEUE_EVENT)) {
        ev->available = ecf->multi_accept;
    }
 
    lc = ev->data;
    ls = lc->listening;
    ev->ready = 0;
 
    do {
        socklen = NGX_SOCKADDRLEN;
 
        /* 1、accept方法试图建立连接,非阻塞调用 */
        s = accept(lc->fd, (struct sockaddr *) sa, &socklen);
 
        if (s == (ngx_socket_t) -1)
        {
            err = ngx_socket_errno;
 
            if (err == NGX_EAGAIN)
            {
                /* 没有连接,直接返回 */
                return;
            }
 
            level = NGX_LOG_ALERT;
 
            if (err == NGX_ECONNABORTED) {
                level = NGX_LOG_ERR;
 
            } else if (err == NGX_EMFILE || err == NGX_ENFILE) {
                level = NGX_LOG_CRIT;
            }
 
            if (err == NGX_ECONNABORTED) {
                if (ngx_event_flags & NGX_USE_KQUEUE_EVENT) {
                    ev->available--;
                }
 
                if (ev->available) {
                    continue;
                }
            }
 
            if (err == NGX_EMFILE || err == NGX_ENFILE) {
                if (ngx_disable_accept_events((ngx_cycle_t *) ngx_cycle)
                    != NGX_OK)
                {
                    return;
                }
 
                if (ngx_use_accept_mutex) {
                    if (ngx_accept_mutex_held) {
                        ngx_shmtx_unlock(&ngx_accept_mutex);
                        ngx_accept_mutex_held = 0;
                    }
 
                    ngx_accept_disabled = 1;
 
                } else {
                    ngx_add_timer(ev, ecf->accept_mutex_delay);
                }
            }
 
            return;
        }
 
        /* 2、设置负载均衡阈值 */
        ngx_accept_disabled = ngx_cycle->connection_n / 8
                              - ngx_cycle->free_connection_n;
 
        /* 3、从连接池获得一个连接对象 */
        c = ngx_get_connection(s, ev->log);
 
        /* 4、为连接创建内存池 */
        c->pool = ngx_create_pool(ls->pool_size, ev->log);
 
        c->sockaddr = ngx_palloc(c->pool, socklen);
 
        ngx_memcpy(c->sockaddr, sa, socklen);
 
        log = ngx_palloc(c->pool, sizeof(ngx_log_t));
 
        /* set a blocking mode for aio and non-blocking mode for others */
        /* 5、设置套接字属性为阻塞或非阻塞 */
        if (ngx_inherited_nonblocking) {
            if (ngx_event_flags & NGX_USE_AIO_EVENT) {
                if (ngx_blocking(s) == -1) {
                    ngx_log_error(NGX_LOG_ALERT, ev->log, ngx_socket_errno,
                                  ngx_blocking_n " failed");
                    ngx_close_accepted_connection(c);
                    return;
                }
            }
 
        } else {
            if (!(ngx_event_flags & (NGX_USE_AIO_EVENT|NGX_USE_RTSIG_EVENT))) {
                if (ngx_nonblocking(s) == -1) {
                    ngx_log_error(NGX_LOG_ALERT, ev->log, ngx_socket_errno,
                                  ngx_nonblocking_n " failed");
                    ngx_close_accepted_connection(c);
                    return;
                }
            }
        }
 
        *log = ls->log;
 
        c->recv = ngx_recv;
        c->send = ngx_send;
        c->recv_chain = ngx_recv_chain;
        c->send_chain = ngx_send_chain;
 
        c->log = log;
        c->pool->log = log;
 
        c->socklen = socklen;
        c->listening = ls;
        c->local_sockaddr = ls->sockaddr;
        c->local_socklen = ls->socklen;
 
        c->unexpected_eof = 1;
 
        rev = c->read;
        wev = c->write;
 
        wev->ready = 1;
 
        if (ngx_event_flags & (NGX_USE_AIO_EVENT|NGX_USE_RTSIG_EVENT)) {
            /* rtsig, aio, iocp */
            rev->ready = 1;
        }
 
        if (ev->deferred_accept) {
            rev->ready = 1;
 
        }
 
        rev->log = log;
        wev->log = log;
 
        /*
         * TODO: MT: - ngx_atomic_fetch_add()
         *             or protection by critical section or light mutex
         *
         * TODO: MP: - allocated in a shared memory
         *           - ngx_atomic_fetch_add()
         *             or protection by critical section or light mutex
         */
 
        c->number = ngx_atomic_fetch_add(ngx_connection_counter, 1);
 
        if (ls->addr_ntop) {
            c->addr_text.data = ngx_pnalloc(c->pool, ls->addr_text_max_len);
            if (c->addr_text.data == NULL) {
                ngx_close_accepted_connection(c);
                return;
            }
 
            c->addr_text.len = ngx_sock_ntop(c->sockaddr, c->socklen,
                                             c->addr_text.data,
                                             ls->addr_text_max_len, 0);
            if (c->addr_text.len == 0) {
                ngx_close_accepted_connection(c);
                return;
            }
        }
 
        /* 6、将新连接对应的读写事件添加到epoll对象中 */
        if (ngx_add_conn && (ngx_event_flags & NGX_USE_EPOLL_EVENT) == 0) {
            if (ngx_add_conn(c) == NGX_ERROR) {
                ngx_close_accepted_connection(c);
                return;
            }
        }
 
        log->data = NULL;
        log->handler = NULL;
 
        /* 7、TCP建立成功调用的方法,这个方法在ngx_listening_t结构体中 */
        ls->handler(c);
 
    } while (ev->available);    /* available标志表示一次尽可能多的建立连接,由配置项multi_accept决定 */
}


Nginx中的“惊群”问题
Nginx一般会运行多个worker进程,这些进程会同时监听同一端口。当有新连接到来时,内核将这些进程全部唤醒,但只有一个进程能够和客户端连接成功,导致其它进程在唤醒时浪费了大量开销,这被称为“惊群”现象。Nginx解决“惊群”的方法是,让进程获得互斥锁ngx_accept_mutex,让进程互斥地进入某一段临界区。在该临界区中,进程将它所要监听的连接对应的读事件添加到epoll模块中,使得当有“新连接”事件发生时,该worker进程会作出反应。这段加锁并添加事件的过程是在函数ngx_trylock_accept_mutex中完成的。而当其它进程也进入该函数想要添加读事件时,发现互斥锁被另外一个进程持有,所以它只能返回,它所监听的事件也无法添加到epoll模块,从而无法响应“新连接”事件。但这会出现一个问题:持有互斥锁的那个进程在什么时候释放互斥锁呢?如果需要等待它处理完所有的事件才释放锁的话,那么会需要相当长的时间。而在这段时间内,其它worker进程无法建立新连接,这显然是不可取的。Nginx的解决办法是:通过ngx_trylock_accept_mutex获得了互斥锁的进程,在获得就绪读/写事件并从epoll_wait返回后,将这些事件归类放入队列中:
  • 新连接事件放入ngx_posted_accept_events队列
  • 已有连接事件放入ngx_posted_events队列
代码如下:
if (flags & NGX_POST_EVENTS)
{
        /* 延后处理这批事件 */
        queue = (ngx_event_t **) (rev->accept ? &ngx_posted_accept_events : &ngx_posted_events);
 
        /* 将事件添加到延后执行队列中 */
        ngx_locked_post_event(rev, queue);
}
else
{
        rev->handler(rev);  /* 不需要延后,则立即处理事件 */
}


写事件做类似处理。进程接下来处理ngx_posted_accept_events队列中的事件,处理完后立即释放互斥锁,使该进程占用锁的时间降到了最低。

Nginx中的负载均衡问题
Nginx中每个进程使用了一个处理负载均衡的阈值ngx_accept_disabled,它在上图的第2步中被初始化:
ngx_accept_disabled = ngx_cycle->connection_n / 8 - ngx_cycle->free_connection_n;
它的初值为一个负数,该负数的绝对值等于总连接数的7/8.当阈值小于0时正常响应新连接事件,当阈值大于0时不再响应新连接事件,并将ngx_accept_disabled减1,代码如下:
if (ngx_accept_disabled > 0)
{
        ngx_accept_disabled--;
}
else
{
    if (ngx_trylock_accept_mutex(cycle) == NGX_ERROR)
    {
        return;
    }
    ....
}


这说明,当某个进程当前的连接数达到能够处理的总连接数的7/8时,负载均衡机制被触发,进程停止响应新连接。

下面介绍整个ngx_process_events_and_timers函数的执行流程:


代码如下,注释中的序号对应上方流程图的序号:
/* 由worker进程循环调用 */
void
ngx_process_events_and_timers(ngx_cycle_t *cycle)
{
    ngx_uint_t  flags;
    ngx_msec_t  timer, delta;

    /* 1、如果设置了timer_resolution配置项,则ngx_timer_resolution大于1
     * 表示用户设置的时间精度
     */
    if (ngx_timer_resolution) {
        timer = NGX_TIMER_INFINITE; /* 检测事件时不等待而是立即返回 */
        flags = 0;

    } else {
        /* 2、获得最近将要发生的事件距离现在的时间
         * 最终传入epoll_wait,告诉epoll无事件发生时的等待长度
         */
        timer = ngx_event_find_timer();
        flags = NGX_UPDATE_TIME;

#if (NGX_THREADS)

        if (timer == NGX_TIMER_INFINITE || timer > 500) {
            timer = 500;
        }

#endif
    }

    /* 3、如果配置文件中设置为使用锁 */
    if (ngx_use_accept_mutex) {
        /* 检测负载均衡阈值 */
        if (ngx_accept_disabled > 0) {
            ngx_accept_disabled--;

        } else {
            /* 4、没有触发负载均衡机制,获取accept_mutex锁 */
            if (ngx_trylock_accept_mutex(cycle) == NGX_ERROR) {
                return;
            }

            /* 5、如果获取到accept_mutex锁,则将flags增加NGX_POST_EVENTS标志
             * 表示不直接执行事件的handler方法,而是分类放入延迟执行的队列中
             */
            if (ngx_accept_mutex_held) {
                flags |= NGX_POST_EVENTS;

            } else {
                /* 6、没有获得accept_mutex锁,那么即使设置了ngx_timer_resolution,
                 * 也需要等待ngx_accept_mutex_delay长的时间,如果没设置ngx_timer_resolution而
                 * 定时器又超时,则强制epoll_wait再等待ngx_accept_mutex_delay长时间。也就是说,
                 * 让没有获得锁的这个进程延迟下一个循环,避免的频繁抢锁。
                 */
                if (timer == NGX_TIMER_INFINITE
                    || timer > ngx_accept_mutex_delay)
                {
                    timer = ngx_accept_mutex_delay;
                }
            }
        }
    }

    delta = ngx_current_msec;

    /* 7、调用epoll处理的ngx_epoll_process_events方法收集、分发事件 */
    (void) ngx_process_events(cycle, timer, flags);

    delta = ngx_current_msec - delta;   /* 计算ngx_process_events执行时间 */

    ngx_log_debug1(NGX_LOG_DEBUG_EVENT, cycle->log, 0,
                   "timer delta: %M", delta);

    /* 8、如果这个队列不为空,则处理队列中建立新连接这类事件 */
    if (ngx_posted_accept_events) {
        ngx_event_process_posted(cycle, &ngx_posted_accept_events);
    }

    /* 9、如果获得了accept_mutex锁,那么立刻释放该锁 */
    if (ngx_accept_mutex_held) {
        ngx_shmtx_unlock(&ngx_accept_mutex);
    }

    if (delta) {
        /* 10、检查定时器中的所有事件,调用超时事件的handler回调方法 */
        ngx_event_expire_timers();
    }

    ngx_log_debug1(NGX_LOG_DEBUG_EVENT, cycle->log, 0,
                   "posted events %p", ngx_posted_events);

    /* 11、如果ngx_posted_events队列不为空,则调用ngx_event_process_posted方法
     * 处理一般的读写事件
     */
    if (ngx_posted_events) {
        if (ngx_threaded) {
            ngx_wakeup_worker_thread(cycle);

        } else {
            ngx_event_process_posted(cycle, &ngx_posted_events);
        }
    }
}

实际上,这个方法就是Nginx处理Web服务的方法,所有业务的执行都是由这个函数开始的。

参考:
《深入理解Nginx》 P328-P338.
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值