一.惊群效应简介
当你往一群鸽子中间扔一块食物,虽然最终只有一个鸽子抢到食物,但所有鸽子都会被惊动来争夺,没有抢到食物的鸽子只好回去继续睡觉, 等待下一块食物到来。这样,每扔一块食物,都会惊动所有的鸽子,即为惊群。
简单地说:就是扔一块食物,所有鸽子来抢,但最终只一个鸽子抢到了食物。
二. 操作系统的惊群
在多进程/多线程等待同一资源时,也会出现惊群。即当某一资源可用时,多个进程/线程会惊醒,竞争资源。这就是操作系统中的惊群。
三. 看一下nginx中解决惊群的方法。
上面是nginx多进程工作方式,顺便提一下,nginx热重启。Master进程重启,监听配置的端口,没有连接的worker进程直接kill掉,由新启动的Master进程Fork新的Worker进程。有连接的nginx进程继续处理当前的连接任务,并且关闭监听套接字。
四. 看一下nginx代码实现
static ngx_int_t ngx_event_module_init(ngx_cycle_t *cycle)
函数中调用,
下面是不支持ATOMIC操作的系统,就用文件锁的方式来处理共享内存读写问题
下面是支持ATOMIC操作的,CAS操作。
nginx尝试加锁,
五 linux内核中如何实现防止惊群的呢?
epoll的时候设置选项EPOLLEXCLUSIVE
m_epollfd = epoll_create1(0);
ev.events = EPOLLIN|EPOLLEXCLUSIVE;
ev.data.fd = m_listenfd;
if(epoll_ctl(m_epollfd, EPOLL_CTL_ADD, m_listenfd, &ev) < 0) {
cout << "add listen socket to epoll err" << endl; exit(EXIT_FAILURE);
}
看下内核代码如何实现的?
设置内核的防止惊群的flag
wakeup的时候的操作
从内核代码看起来,确实是不会惊群了,具体还没有在应用层做过这样的测试。
有兴趣的朋友可以试试。