我们在学习Redis的过程中都说Redis快,redis是单线程的,但是我们有没有想过单线程的Redis为什么会这么快呢?
确实,Redis在6.0之前都是单线程模型,这主要指的是Redis的网络IO和键值对的读写都是由一个线程来完成的,这也是Redis提供键值存储服务的主要流程。但是相对于Redis中其他的功能,比如持久化、集群等确是由额外的线程执行的。
为什么要用单线程?
相比较单线程,我们经常会听到一个说法,为了提高性能和效率,使用多线程可以增加系统吞吐率、增加系统的扩展性。的确在合理分配资源的情况下,可以增加系统中处理请求的线程,使得系统可以同时处理多个请求,增加系统的吞吐率。但是,这也存在一个瓶颈,系统中的共享资源被多线程操作时,如果多个线程都要修改该资源,为了保证资源的正确性,就要通过加锁来进行保证,这也带来了额外的开销。如果没有合理的系统设计,单纯的增加线程,只会适得其反。所以Redis为了避免这些问题,直接使用单线程模式。
Redis为什么这么快?
相比较于对多线程,Redis使用单线程为什么这么快呢?一方面Redis的大部分操作都是在内存中完成的,以及它底层的数据结构都是比较高效的。另一方面,Redis采用了多路复用机制,其在网络IO操作下并发处理大量客户端请求,可以实现高吞吐率。
多路复用IO模型
在Linux中IO多路复用机制,就是指衣蛾一个线程处理多个IO流,我们常听到的select/epoll机制,换句话说就是在单线程下,该机制运行内核中,可以同时存在多个监听套接字和已连接套接字。内核会一直监听这些套接字的请求,一旦有请求到达,就会交个Redis线程处理,这样就可以实现一个Redis线程处理多个IO流的效果。
如图中Redis的多路复用模型,内核在监听套接字时,Redis不会阻塞在某一个套接字上,可以同时处理多个客户端发来的请求,提高并发。同时在请求到达时,select/epoll的回调机制,会根据不同的事件,调用不同的处理函数。将这些事件放入一个事件队列,Redis单线程对事件不断处理,这样Redis无需一直轮询是否有请求,避免CPU资源的浪费。同时Redis在处理事件时,通过事件的回调函数,也可以及时相应客户端的请求。
最后我们其实也可以发现,Redis的单线程是指网络IO和数据的读写操作采用了一个线程,并且使用单线程的主要原因就是避免的多线程下并发控制的问题,通过多路复用的IO模型,也可以获得高性能。