Redis总结

木唯韵

于 2023-03-15 20:53:18 发布

阅读量234

点赞数

分类专栏：深入浅出Redis 文章标签： redis Powered by 金山文档

本文链接：https://blog.csdn.net/muweiyun/article/details/129568319

版权

深入浅出Redis 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

什么是Redis？

Redis ，全称 Remote Dictionary Server ,是一个基于内存的高性能Key-Value 数据库。Redis 已经成为互联网公司在缓存组件选择的唯一。例如说，在各种公有云上，缓存服务都是提供的 Redis.再例如说,招聘简历要求上,都会要求掌握 Redis 。

Redis优点

速度快

因为数据存在内存中，类似于HashMap , HashMap 的优势就是查找和操作的时间复杂度都是O(1)。

Redis本质上是一个Key-Value类型的内存数据库，很像Memcached ,整

个数据库统统加载在内存当中进行操作，定期通过异步操作把数据库数据flush

到硬盘上进行保存。

因为是纯内存操作，Redis 的性能非常出色，每秒可以处理超过10万次读写操作，是已知性能最快的 Key-Value数据库。

支持丰富数据类型

支持String , List，Set，Sorted Set，Hash五种基础的数据结构。

Redis 的出色之处不仅仅是性能，Redis最大的魅力是支持保存多种数据结构，此外单个Value 的最大限制是1GB，不像Memcached 只能保存1MB的数据，因此 Redis可以用来实现很多有用的功能。比方说︰

用他的List来做FIFO 双向链表，实现一个轻量级的高性能消息队列服务。

用他的Set可以做高性能的tag系统等等。

丰富的特性

订阅发布Pub / Sub 功能Key过期策略

事务

支持多个DB

计数

持久化存储

Redis提供RDB和AOF两种数据的持久化存储方案,解决内存数据库最担心的万一Redis挂掉，数据会消失掉。

高可用

内置Redis Sentinel ,提供高可用方案，实现主从故障自动转移。

内置Redis Cluster ,提供集群方案，实现基于槽的分片方案，从而支持更大的Redis规模。

Redis缺点

内存占用

由于Redis是内存数据库，所以，单台机器，存储的数据量，跟机器本身的内存大小。虽然 Redis本身有Key过期策略，但是还是需要提前预估和节约

内存。如果内存增长过快，需要定期删除数据。

另外,可使用Redis Cluster、Codis等方案,对Redis进行分区,从单机 Redis变成集群Redis。

重同步占用CPU

如果进行完整重同步，由于需要生成RDB文件，并进行传输，会占用主机的CPU，并会消耗现网的带宽。不过Redis2.8版本，已经有部分重同步的功能，但是还是有可能有完整重同步的。

Redis不能提供服务的情况

修改配置文件，进行重启，将硬盘中的数据加载进内存，时间比较久。在这个过程中，Redis不能提供服务。

Redis的线程模型

Redis内部使用文件事件处理器file event handler，这个文件事件处理器是单线程的，所以 Redis才叫做单线程的模型。它采用IO多路复用机制同时监听多个Socket，根据Socket 上的事件来选择对应的事件处理器进行处理。

文件时间处理器的结构包含四个部分：

多个Socket

IO多路复用程序

文件时间分派器

事件处理器（连接应答处理器、命令请求处理器、命令回复处理器）

多个Socket可能会并发产生不同的操作，每个操作对应不同的文件事件，但是IO多路复用程序会监听多个socket，会将socket 产生的事件放入队列中

排队，事件分派器每次从队列中取出一个事件，把该事件交给对应的事件处理器

进行处理。

为什么Redis单线程模型也能效率这么高

C语言实现：

C语言的执行速度非常快。

纯内存操作

Redis为了达到最快的读写速度，将数据都读到内存中，并通过异步的方式将数据写入磁盘。所以Redis具有快速和数据持久化的特征。

基于非阻塞的IO多路复用机制

单线程，避免了多线程的频繁上下文切换问题

Redis利用队列技术，将并发访问变为串行访问，消除了传统数据库串行控制的开销。

丰富的数据结构

Redis全程使用hash结构，读取速度快，还有一些特殊的数据结构，对数据存储进行了优化。例如，压缩表，对短数据进行压缩存储；跳表，使用有序的数据结构加快读取的速度。

也因为Redis是单线程的，所以可以实现丰富的数据结构，无需考虑并发的问题。

Redis是单线程的，如何提高多核CPU的利用率

可以在同一个服务器部署多个Redis的实例，并把他们当作不同的服务器来使用，在某些时候，无论如何一个服务器是不够的，所以，如果你想使用多个

CPU ，你可以考虑一下分区。

Redis持久化方式

Redis提供了两种方式，实现数据的持久化到硬盘

（全量）RDB持久化

是指在指定的时间间隔内将内存中的数据集快照写入磁盘。实际操作过程是，fork一个子进程，先将数据集写入临时文件，写入成功后，再替换之前的文件，用二进制压缩存储。

（增量）AOF持久化

以日志的形式记录服务器所处理的每一个写、删除操作，查询操作不会记录，以文本的方式记录，可以打开文件看到详细的操作记录。

RDB优缺点

优点

灵活设置备份频率和周期。

非常适合冷备份，对于灾难恢复而言，RDB是非常不错的选择。可以非常轻松地将一个单独的文件压缩后再转移到其它存储介质上。

性能最大化。对于Redis 的服务进程而言，在开始持久化时，它唯一需要做的只是fork出子进程，之后再由子进程完成这些持久化的工作，这样就可以极大的避免服务进程执行IO操作了。也就是说，RDB对 Redis 对外提供的读写服务，影响非常小，可以让Redis保持高性能。

恢复更快。相对于AOF机制，RDB的恢复速度更快，更适合恢复数据，特别是在数据集非常大的情况。

缺点

无法保障数据的高可用性，即无法最大限度的避免数据丢失。因为系统一旦在定时持久化之前出现宕机现象，此前没有来得及写入磁盘的数据都将丢失。

可能会使服务器停止服务几百毫秒。RDB是通过fork子进程来协助完成数据持久化工作的，当数据集比较大时，会导致服务器停止服务。

AOF优缺点

优点

该机制可以带来更高的数据安全性，即数据持久性。Redis中提供了3种同步策略，即每秒同步、每修改(执行一个命令)同步和不同步。

事实上，每秒同步也是异步完成的，其效率也是非常高的，所差的是一旦系统出现宕机现象，那么这一秒钟之内修改的数据将会丢失。

而每修改同步，我们可以将其视为同步持久化，即每次发生的数据变化都会被立即记录到磁盘中。可以预见，这种方式在效率上是最低的。

至于不同步，无需多言，我想大家都能正确的理解它。

由于该机制对日志文件的写入操作采用的是append模式，因此在写入过程中即使出现宕机现象，也不会破坏日志文件中已经存在的内容。

因为以append-only 模式写入，所以没有任何磁盘寻址的开销，写入性能非常高。

另外，如果我们本次操作只是写入了一半数据就出现了系统崩溃问题，不用担心，在 Redis下一次启动之前，我们可以通过redis-check-aof工具来帮助我们解决数据一致性的问题。

如果AOF日志过大，Redis 可以自动启用rewrite 机制。即使出现后台重写操作，也不会影响客户端的读写。因为在rewrite log 的时候，会对其中的指令进行压缩，创建出一份需要恢复数据的最小日志出来。再创建新日志文件的时候，老的日志文件还是照常写入。当新的merge 后的日志文件 ready 的时候，再交换新老日志文件即可。

注意，AOF rewrite 机制，和RDB一样，也需要fork出一次子进程，如果

Redis内存比较大，可能会因为fork 阻塞下主进程。

AOF包含一个格式清晰、易于理解的日志文件用于记录所有的修改操作。事实上，我们也可以通过该文件完成数据的重建。

缺点

对于相同数量的数据集而言，AOF文件通常要大于RDB文件。RDB在恢复

大数据集时的速度比AOF的恢复速度要快。

根据同步策略的不同，AOF在运行效率上往往会慢于RDB。总之，每秒同

步策略的效率是比较高的，同步禁用策略的效率和RDB一样高效。

以前AOF发生过bug ，就是通过AOF记录的日志，进行数据恢复的时候，

没有恢复一模―样的数据出来。所以说，类似AOF 这种较为复杂的基于命令日

志/merge/回放的方式，比基于RDB每次持久化一份完整的数据快照文件的方

式，更加脆弱一些，容易有bug。不过AOF 就是为了避免rewrite过程导致

的 bug ，因此每次rewrite并不是基于旧的指令日志进行merge 的，而是基

于当时内存中的数据进行指令的重新构建，这样健壮性会好很多。

不建议在Redis节点开启RDB功能

因为会带来一定时间的阻塞，特别是数据量大的时候。

子进程fork相关的阻塞

在bgsave 的时候,Redis主进程会fork一个子进程，利用操作系统的写时复制技术，这个子进程在拷贝父进程的时候理论上是很快的，因为并不需要全拷贝，比如主进程虽然占了10G内存，但子进程拷贝他可能只要200毫秒，我认为也就阻塞了200毫秒(此耗时基本跟主进程占用的内存是成正比的)，这个具体的时间可以通过统计项info stats 里的last_fork_usec查看。

CPU单线程相关的阻塞

CPU单线程相关的阻塞︰Redis主进程是单线程跑在单核CPU上的，如果

显示绑定了CPU ，则子进程会与主进程共享一个CPU ，而子进程进行持久化

的时候是非常占CPU(强势90%)，因此这种情况也可能导致提供服务的主进程发生阻塞(因此如果需要持久化功能，不建议绑定CPU)

内存相关的阻塞

虽然利用写时复制技术可以大大降低进程拷贝的内存消耗，但这也导致了父进程在处理写请求时需要维护修改的内存页，因此这部分内存过大的话（修改页数多或每页占空间大)也会导致父进程的写操作阻塞。(而不巧的是，Linux中TransparentHugePage会将复制内存页面单位有4K 变成2M ，这对于Redis来说是比较不友好的，也是建议优化的，具体可百度之)