问题:
nginx是一个高性能网络并发服务器,它的进程模型是,多进程模型,有一个master进程,会启动多个worker进程,(一般是根据cpu内核个数决定)然后每个进程又利用IO多路复用技术,监听多个socket,达到高并发的能力。
它存在一个问题就在于,每个worker子进程都会去accept()监听套接字,当监听套接字有一个时间到来,那么所有子进程都会被唤醒去获取事件,但是最终只会有一个进程真正获取到对应事件,这种性能浪费就叫做惊群。
解决方案:
其实在Linux2.6中,内核已经解决了惊群问题,其处理方式就是,对于accept(),当内核接收到一个客户连接后,只会唤醒等待队列上的一个进程或线程。如果服务器采用accept阻塞调用方式,在最新linux系统上,已经没有惊群问题。
实际工程中,一般都是会直接使用select,poll,epoll等IO多路复用机制,一般会阻塞在epoll,然后有连接到来才会去调用accept函数,在早起的Linux版本中,对于epoll也是会全部唤醒,在最新的版本中,同样也是只会唤醒等待队列中的第一个进程或线程。所以新版本部分的解决了epoll的惊群问题。
部分的解决,是说在一些场景下已经不存在惊群问题,但是在一些特殊场景下,依然有这个问题。