单线程的Redis如何能够高并发

单线程的Redis如何能够高并发

参考:

单进程单线程的Redis如何能够高并发

Redis为什么是单线程,高并发快的3大原因详解

为什么redis 是单线程的?

0.预备知识

CPU到底比内存跟硬盘快多少

大概意思是:

假设把CPU执行一个指令的时间定义为1s

  • 则读取一级缓存将花费1.3s
  • 分支预测将花费13s
  • 读取二级缓存将花费18.2s
  • 内存寻址260s,将近4分钟
  • 一次CPU上下文切换大概需要65分钟
  • 在1Gbps的网络上传输 2K 的数据需要14.4小时

比网络传输性能更低的是 IO 操作

  • SSD 寻址耗时为 180us,对应的人类时间大约是 5天
  • 从内存中读取 1MB 的连续数据,对应的人类时间是 7.5天
  • 同一个数据中心网络上跑一个来回需要大约 15天
  • 从 SSD 读取 1MB 的顺序数据,大约需要1个月

再让我们来看看磁盘的表现:

  • 磁盘寻址时间为 10ms,对应的人类时间是 10个月
  • 从磁盘读取 1MB 连续数据需要 20个月
  • 数据请求在地球上两个不同城市之间来回走一趟大概需要12.5年

说明CPU很快,缓存也较快,但是内存读取已经很慢了,磁盘就是龟速了

什么是CPU密集型、IO密集型?

CPU密集型(CPU-bound)
CPU密集型也叫计算密集型,指的是系统的硬盘、内存性能相对CPU要好很多,此时,系统运作大部分的状况是CPU Loading 100%,CPU要读/写I/O(硬盘/内存),I/O在很短的时间就可以完成,而CPU还有许多运算要处理,CPU Loading很高。

在多重程序系统中,大部份时间用来做计算、逻辑判断等CPU动作的程序称之CPU bound。例如一个计算圆周率至小数点一千位以下的程序,在执行的过程当中绝大部份时间用在三角函数和开根号的计算,便是属于CPU bound的程序。

CPU bound的程序一般而言CPU占用率相当高。这可能是因为任务本身不太需要访问I/O设备,也可能是因为程序是多线程实现因此屏蔽掉了等待I/O的时间。

IO密集型(I/O bound)
IO密集型指的是系统的CPU性能相对硬盘、内存要好很多,此时,系统运作,大部分的状况是CPU在等I/O (硬盘/内存) 的读/写操作,此时CPU Loading并不高。

I/O bound的程序一般在达到性能极限时,CPU占用率仍然较低。这可能是因为任务本身需要大量I/O操作,而pipeline做得不是很好,没有充分利用处理器能力。

CPU密集型 vs IO密集型
我们可以把任务分为计算密集型和IO密集型。

计算密集型任务的特点是要进行大量的计算,消耗CPU资源,比如计算圆周率、对视频进行高清解码等等,全靠CPU的运算能力。这种计算密集型任务虽然也可以用多任务完成,但是任务越多,花在任务切换的时间就越多,CPU执行任务的效率就越低,所以,要最高效地利用CPU,计算密集型任务同时进行的数量应当等于CPU的核心数。

计算密集型任务由于主要消耗CPU资源,因此,代码运行效率至关重要。

第二种任务的类型是IO密集型,涉及到网络、磁盘IO的任务都是IO密集型任务,这类任务的特点是CPU消耗很少,任务的大部分时间都在等待IO操作完成(因为IO的速度远远低于CPU和内存的速度)。对于IO密集型任务,任务越多,CPU效率越高,但也有一个限度。常见的大部分任务都是IO密集型任务,比如Web应用。

IO密集型任务执行期间,99%的时间都花在IO上,花在CPU上的时间很少,因此,用运行速度极快的C语言替换用Python这样运行速度极低的脚本语言,完全无法提升运行效率。

1.官方答案

因为Redis是基于内存的操作,CPU不是Redis的瓶颈,Redis的瓶颈最有可能是机器内存的大小或者网络带宽。既然单线程容易实现,而且CPU不会成为瓶颈,那就顺理成章地采用单线程的方案。

如何理解“CPU不是Redis的瓶颈

因为redis是io密集型,需要的是读取和存储性能,而计算密集型是消耗cpu的。

既然是io密集型的,那用多线程不更好吗?用单线程,那CPU等待io完成的时间不是被浪费了吗? 一般不是说IO密集型用多线程比较好,计算密集型则不要开太多线程。

这是第二个问题了,这个问题答案是 io多路复用

IO多路复用确实可以避免浪费等待时间,那这里直接用多线程也是可以的吧,只是redis实现的时候采用了单线程+IO复用,并不代表不能用多线程来操作内存数据库吧。

嗯嗯,可以实现,就是不好

如果万一CPU成为你的Redis瓶颈了,或者,你就是不想让服务器其他核闲置,那怎么办?
那也很简单,你多起几个Redis进程就好了。Redis是keyvalue数据库,又不是关系数据库,数据之间没有约束。只要客户端分清哪些key放在哪个Redis进程上就可以了。redis-cluster可以帮你做的更好。

其他补充答案

  1. 多线程处理会涉及到线程切换而消耗CPU
    redis 核心就是 如果我的数据全都在内存里,我单线程的去操作 就是效率最高的,为什么呢,因为多线程的本质就是 CPU 模拟出来多个线程的情况,这种模拟出来的情况就有一个代价,就是上下文的切换,对于一个内存的系统来说,它没有上下文的切换就是效率最高的。redis 用 单个CPU 绑定一块内存的数据,然后针对这块内存的数据进行多次读写的时候,都是在一个CPU上完成的,所以它是单线程处理这个事。在内存的情况下,这个方案就是最佳方案 —— 阿里 沈询

  2. 多线程处理可能涉及到锁 ,单线程避免了锁的开销

  3. 使用多路I/O复用模型,非阻塞IO

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值