Redis的高可用与持久化

最新推荐文章于 2024-11-03 16:03:04 发布

川子^

最新推荐文章于 2024-11-03 16:03:04 发布

阅读量1.1k

点赞数 2

文章标签： redis 数据库缓存

本文链接：https://blog.csdn.net/weixin_60917414/article/details/131465169

版权

文章详细介绍了Redis的高可用性方案，包括持久化（RDB和AOF）、主从复制、哨兵和集群。RDB是定期保存内存快照，AOF记录命令日志，两者各有优缺点。此外，文章还讨论了Redis的内存管理和性能优化，包括内存碎片、内存使用率、内存回收策略，以及常见的Redis问题和解决方案，如缓存雪崩、缓存击穿和缓存穿透等。

摘要由CSDN通过智能技术生成

一、Redis 高可用

在 web 服务器中，高可用是指服务器可以正常访问的时间，衡量的标准是在多长时间内可以提供正常服务(99.9%、99.99%、99.999%等等)。
但是在 Redis 语境中，高可用除了保证提供正常服务(如主从分离、快速容灾技术)，还需要考虑数据容量的扩展，数据安全不会丢失等。
在 Redis 中，实现高可用的技术主要包括持久化、主从复制、哨兵和集群

1. 持久化

主要作用是数据备份，即把数据保存在一个位置或者磁盘中

2. 主从复制

主从复制是高可用 Redis 的基础，主从复制主要实现了数据的多机备份，以及对于读操作的负载均衡和简单的故障恢复
缺陷：故障恢复无法自动化，写操作无法负载均衡，单机的原因限制了存储能力

3. 哨兵

需要在主从复制的基础上实现自动化的故障恢复
缺陷：写操作无法实现负载均衡，单机的原因限制了存储能力

4. 集群(cluster)

通过集群，Redis 解决了写操作无法负载均衡，以及存储能力受到单机限制的问题
实现了较为完善的高可用方案

二、Redis 持久化方式

1. 持久化的功能

Redis 是内存数据库，数据都是存储在内存中，为了避免服务器断电等原因导致 Redis 进程异常退出后数据的永久丢失，需要定期将 Redis 中的数据以某种形式 (数据或命令) 从内存保存到硬盘
当下次 Redis 重启时，利用持久化文件实现数据恢复。除此之外，为了进行灾难备份，可以将持久化文件拷贝到一个远程位置（NFS) 。

2. 持久化的方式

RDB 持久化
原理是将 Reids 在内存中的数据库记录定时保存到磁盘上 (类似于快照)
AOF 持久化 (append only file)
目前主流的持久化方式
原理是将 Reids 的操作日志以追加的方式写入文件，类似于 MySQL 的 binlog。 (基于日志持久化方式)

三、RDB 持久化

又称快照持久化，指在指定的时间间隔内将内存中当前进程中的数据生成快照保存到硬盘，用二进制压缩存储，保存的文件后缀是rdb
当 Redis 重新启动时，可以读取快照文件恢复数据

1. 触发条件

手动触发(生成RDB文件：save命令、bgsave命令)

① save命令会阻塞 Redis 服务器进程，直到 RDB 文件创建完毕为止，在 Redis 服务器阻塞期间，服务器不能处理任何命令请求
② bgsave 命令——>派生子进程——>子进程来创建 RDB 文件并阻塞服务器——>父进程(主进程)则继续处理请求

自动触发

① 在自动触发 RDB 持久化时，Redis 会选择 bgsave 来进行持久化
② save m n      ##自动触发通常是在配置文件中此命令触发 bgsave
m：多少 s 内； n：发生多少次

#通过配置设置触发
save m n

#自动触发最常见的情况是在配置文件中通过save m n，指定当m秒内发生n次变化时，会触发bgsave。
vim /usr/local/redis/conf/redis.conf

#-----443行--以下三个save条件满足任意一个时，都会引起bgsave的调用
# save 3600 1 300 100 60 10000
save 900 1 ：当时间到900秒时，如果redis数据发生了至少1次变化，则执行bgsave
save 300 10 ：当时间到300秒时， 如果redis数据发生了至少10次变化，则执行bgsave
save 60 10000 ：当时间到60秒时，如果redis数据发生了至少10000次变化， 则执行bgsave

#-----242行--是否开启RDB文件压缩

rdbcompression yes

其他自动触发机制

① 在主从复制场景下，如果从节点执行全量复制操作，则主节点会执行bgsave命令，并将rdb文件发送给从节点
② 执行shutdown命令时，自动执行rdb持久化

2.执行流程

Redis 父进程首先判断:当前是否在执行 save，或 bgsave/bgrewriteaof 的子进程，如果在执行则 bgsave 命令直接返回 bgsave/bgrewriteaof
父进程执行 fork 操作创建子进程，这个过程中父进程是阻塞的，Redis 不能执行来自客户端的任何命令
父进程 fork后，bgsave 命令返回 ”Background saving started" 信息并不再阻塞父进程，并可以响应其他命令
子进程创建 RDB文件，根据父进程内存快照生成临时快照文件，完成后对原有文件进行原子替换
子进程发送信号给父进程表示完成，父进程更新统计信息

3. 启动时加载

RDB 文件的载入工作是在服务器启动时自动执行的，并没有专门的命令
优先级：AOF>RDB，因此当 AOF 开启时，默认先载入 AOF 文件，仅当 AOF 关闭，才会载入 RDB 文件
Redis 载入 RDB 文件时(即启动过程中)，会对RDB 文件进行校验，如果文件损坏，则日志中会打印错误，Redis启动失败

四、AOF持久化

是将 Redis 执行的每次写、删除命令记录到单独的日志文件中，查询操作不会记录
当 Redis 重启时优先执行 AOF 文件中的命令来恢复数据。

1.开启 AOF

Redis 服务器默认开启 RDB，关闭 AOF，要开启AOF，需要在配置文件中配置

vim /usr/local/redis/conf/redis.conf

#————1380行————修改，开启AOF
appendonly yes
#————1407行————指定AOE文件名称
appendfilename "appendonly.aof"
#————1505行————是否忽略最后一条可能存在问题的指令
aof-load-truncated yes

systemctl restart redis-server.service

2. 执行流程

由于需要记录 Redis 的每条写命令，因此 A0F 不需要触发，AOF 的执行流程如下

① 命令追加(append)
将Redis的写命令追加到缓冲区aof_buf; (为了尽量不因为持久化而影响redis性能)
② 文件写入(write)和文件同步(sync)
根据不同的同步策略将 aof_buf 中的内容同步到硬盘，所以 Redis 系统同时提供了 fsync、fdatasync 等同步函数，可以强制操作系统立刻将缓冲区中的数据写入到硬盘里，从而确保数据的安全性。
③ 文件重写(rewrite)
定期重写AOF文件，达到压缩的目的

2.1 命令追加

Redis先将写命令追加到缓冲区，而不是直接写入文件，主要是为了避免每次有写命令都直接写入硬盘，导致硬盘IO成为Redis负载的瓶颈。
命令追加的格式是Redis命令请求的协议格式，它是一种纯文本格式，具有兼容性好、可读性强、容易处理、操作简单避免二次开销等优点。在A0F文件中，除了用于指定数据库的select命令（如 select 0为选中0号数据库）是由Redis添加的，其他都是客户端发送来的写命令。

2.2 文件写入（write）和文件同步（sync）

Redis 提供了多种AOF缓存区的同步文件策略，策略涉及到操作系统的write函数和fsync函数，说明如下：
为了提高文件写入效率，在现代操作系统中，当用户调用write函数将数据写入文件时，操作系统通常会将数据暂存到一个内存缓冲区里，当缓冲区被填满或超过了指定时限后，才真正将缓冲区的数据写入到硬盘里。这样的操作虽然提高了效率，但也带来了安全问题：如果计算机停机，内存缓冲区中的数据会丢失；因此系统同时提供了fsync、fdatasync等同步函数，可以强制操作系统立刻将缓冲区中的数据写入到硬盘里，从而确保数据的安全性。

AOF缓存区的同步文件策略存在三种同步方式，它们分别是：

appendfsync always ：一直触发
appendfsync no ：不进行持久化
appendfsync everysec：每一秒触发

vim /usr/local/redis/conf/redis.conf

#---1439---
appendfsync always
#解释： 命令写入aof_ buf后立即调用系统fsync操作同步到AOF文件，fsync完成后线程返回。
#	   这种情况下，每次有写命令都要同步到AOF文件，硬盘IO成为性能瓶颈，Redis只能支持大约几百TPS写入，
#	   严重降低了Redis的性能；即便是使用固态硬盘(SSD)，每秒大约也只能处理几万个命令，而且会大大降低SSD的寿命。

appendfsync no
#解释： 命令写入aof_ buf后调用系统write操作，不对AOF文件做fsync同步;
#	   同步由操作系统负责，通常同步周期为30秒。这种情况下，文件同步的时间不可控，
#	   且缓冲区中堆积的数据会很多，数据安全性无法保证。

appendfsync everysec
#解释： 命令写入aof_ buf后调用系统write操作，write完成后线程返回; 
#	   fsync同步文件操作由专门的线程每秒调用一次。
#	   everysec是前述两种策略的折中，是性能和数据安全性的平衡，
#	   因此是Redis的默认配置，也是我们推荐的配置。

3. 文件重写(rewrite）

随着时间流逝，Redis服务器执行的写命令越来越多，AOF文件也会越来越大：过大的AOF文件不仅会影响服务器的正常运行，也会导致数据恢复需要的时间过长。

文件重写是指定期重写AOF文件，减小AOF文件的体积。需要注意的是，AOF重写是把Redis进程内的数据转化为写命令，同步到新的AOF文件；不会对旧的AOF文件进行任何读取、写入操作!

关于文件重写需要注意的另一点是：对于AOF持久化来说，文件重写虽然是强烈推荐的，但并不是必须的；即使没有文件重写，数据也可以被持久化并在Redis启动的时候导入；因此在一些实现中，会关闭自动的文件重写，然后通过定时任务在每天的某一时刻定时执行。

文件重写能压缩AOF文件的原因

过期的数据不再写入文件；
无效的命令不再写入文件：如有些数据被重复设值（set mykey v1 ， set mykey v2）、有些数据被删除了（sadd myset v1 ，del myset）等。
多条命令可以合并为一个：如 sadd myset v1 ，sadd myset v2， sadd myset vt3 可以合并为 sadd myset v1 v2 v3 。

通过上述内容可以看出，由于重写后AOF执行的命令减少了，文件重写既可以减少文件占用的空间，也可以加快恢复速度。

文件重写的触发
文件重写的触发，分为手动触发和自动触发。

手动触发：直接调用 bgrewriteaof 命令，该命令的执行与 bgsave 有些类似：都是fork子进程进行具体的工作，且都只有在fork时阻塞。
自动触发：通过设置 auto-aof-rewrite-min-size 选项和 auto-aof-rewrite-percentage 选项来自动执行BGREWRITEAOF。只有当 auto-aof-rewrite-min-size 和 auto-aof-rewrite-percentage两个选项同时满足时，才会自动触发AOF重写，即bgrewriteaof操作。

vim /usr/local/redis/conf/redis.conf
#----1480----
auto-aof-rewrite-percentage 100
#当前AOF文件大小(即aof_current_size)是上次日志重写时AOF文件大小(aof_base_size)两倍时，发生BGREWRITEAOF操作
auto-aof-rewrite-min-size 64mb
#当前A0F文件执行BGREWRITEAOF命令的最小值，避免刚开始启动Reids时由于文件尺寸较小导致频繁的BGREWR ITEAOF

4、文件重写的流程

关于文件重写的流程，有两点需要特别注意：

重写由父进程fork子进程进行;
重写期间cerdtis执行的写命令，需要追加到新的kac文件中，为比oedis引入了aofrewite_buf缓存。

具体流程如下：

Redis父进程首先判断当前是否存在正在执行 bgsave / bgrewriteaof 的子进程，如果存在则 bgrewriteaof 命令直接返回，如果存在 bgsave 命令则等 bgsave 执行完成后再执行
父进程执行fork操作创建子进程，这个过程中父进程是阻塞的。
① 父进程fork后，bgrewriteaof 命令返回 “Background append only file rewrite started” 信息并不再阻塞父进程，并可以响应其他命令。Redis的所有写命令依然写入AOF缓冲区，并根据appendfsync策略同步到硬盘，保证原有AOF机制的正确。

② 由于fork操作使用写时复制技术，子进程只能共享fork操作时的内存数据。由于父进程依然在响应命令，因此Redis使用AOF重写缓冲区（aof_rewrite_buf）保存这部分数据，防止新AOF文件生成期间丢失这部分数据。也就是说，bgrewriteaof 执行期间，Redis的写命令同时追加到 aof_ buf 和 aof_ rewirte_ buf 两个缓冲区。
子进程根据内存快照，按照命令合并规则写入到新的AOF文件。
① 子进程写完新的AOF文件后，向父进程发信号，父进程更新统计信息，具体可以通过 info persistence 查看。
② 父进程把AOF重写缓冲区的数据写入到新的AOF文件，这样就保证了新AOF文件所保存的数据库状态和服务器当前状态一致。
③ 使用新的AOF文件替换老文件，完成AOF重写。

5. 启动时加载

当AOF开启时，Redis启动时会优先载入AOF文件来恢复数据;只有当AOF关闭时，才会载入RDB文件恢复数据。
当AOF开启，但AOF文件不存在时，即使RDB文件存在也不会加载。
Redis载入AOF文件时，会对AOF文件进行校验，如果文件损坏，则日志中会打印错误，Redis启动失败。但如果是AOF文件结尾不完整(机器突然宕机等容易导致文件尾部不完整)，且 aof-load- truncated 参数开启，则日志中会输出警告，Redis忽略掉AOF文件的尾部，启动成功。
aof-load-truncated 参数默认是开启的。

6. RDB 和 AOF 的优缺点

6.1 RDB 持久化的优缺点

优点：RDB文件紧凑，体积小，网络传输快，适合全量复制;恢复速度比AOF快很多。当然，与AOF相比， RDB最重要的优点之一是对性能的影响相对较小。
缺点：RDB文件的致命缺点在于其数据快照的持久化方式决定了必然做不到实时持久化，而在数据越来越重要的今天，数据的大量丢失很多时候是无法接受的，因此AOF持久化成为主流。此外，RDB文件需要满足特定格式，兼容性差(如老版本的Redis不兼容新版本的RDB文件)。对于RDB持久化，一方面是bgsave在进行fork操作时Redis主进程会阻塞，另一方面，子进程向硬盘写数据也会带来IO压力。

6.2 AOF 持久化的优缺点

与RDB持久化相对应，AOF的优点在于支持秒级持久化、兼容性好，缺点是文件大、恢复速度慢、对性能影响大。
对于AOF持久化，向硬盘写数据的频率大大提高(everysec策略下为秒级)，IO压力更大，甚至可能造成AOF追加阻塞问题。
AOF文件的重写与RDB的bgsave类似，会有fork时的阻塞和子进程的I0压力问题。相对来说，由于AOF向硬盘中写数据的频率更高，因此对Redis主进程性能的影响会更大。

五、Redis 性能管理

1. 查看 Redis 内存使用

192.168.145.60:7001> info memory

2. 内存碎片率

mem_fragmentation_ratio：内存碎片率。mem_fragmentation_ratio = used_memory_rss / used_memory
used_memory_rss：是Redis向操作系统申请的内存。
used_memory：是Redis中的数据占用的内存。
used_memory_peak：redis内存使用的峰值。

2. 1内存碎片如何产生的？

Redis内部有自己的内存管理器，为了提高内存使用的效率，来对内存的申请和释放进行管理。
Redis中的值删除的时候，并没有把内存直接释放，交还给操作系统，而是交给了Redis内部有内存管理器。
Redis中申请内存的时候，也是先看自己的内存管理器中是否有足够的内存可用。
Redis的这种机制，提高了内存的使用率，但是会使Redis中有部分自己没在用，却不释放的内存，导致了内存碎片的发生。

2.2 跟踪内存碎片率

跟踪内存碎片率对理解Redis实例的资源性能是非常重要的：

内存碎片率在1到1.5之间是正常的，这个值表示内存碎片率比较低，也说明 Redis 没有发生内存交换。
内存碎片率超过1.5，说明Redis消耗了实际需要物理内存的150%，其中50%是内存碎片率。
内存碎片率低于1的，说明Redis内存分配超出了物理内存，操作系统正在进行内存交换。需要增加可用物理内存或减少 Redis内存占用。

2.3 解决碎片率大的问题

如果你的Redis版本是4.0以下的，需要在 redis-cli 工具上输入 shutdown save 命令，让 Redis 数据库执行保存操作并关闭 Redis 服务，再重启服务器。Redis服务器重启后，Redis会将没用的内存归还给操作系统，碎片率会降下来。
Redis4.0版本开始，可以在不重启的情况下，线上整理内存碎片。

config set activedefrag yes     #自动碎片清理，内存就会自动清理了。
memory purge					#手动碎片清理

3. 内存使用率

redis实例的内存使用率超过可用最大内存，操作系统将开始进行内存与swap空间交换。

3.1 避免内存交换发生的方法

针对缓存数据大小选择安装 Redis 实例；
尽可能的使用Hash数据结构存储；
设置key的过期时间。

4. 内回收 key

内存数据淘汰策略，保证合理分配redis有限的内存资源。
当达到设置的最大阀值时，需选择一种key的回收策略，默认情况下回收策略是禁止删除。
配置文件中修改 maxmemory-policy 属性值：

vim /usr/local/redis/conf/redis.conf
--1149--
maxmemory-policy noenviction

volatile-lru：使用LRU算法从已设置过期时间的数据集合中淘汰数据(移除最近最少使用的key，针对设置了TTL的key)
volatile-ttl：从已设置过期时间的数据集合中挑选即将过期的数据淘汰（移除最近过期的key）
volatile-random：从已设置过期时间的数据集合中随机挑选数据淘汰（在设置了TTL的key里随机移除）
allkeys-lru：使用LRU算法从所有数据集合中淘汰数据（移除最少使用的key，针对所有的key）
allkeys-random：从数据集合中任意选择数据淘汰（随机移除key）
noenviction：禁止淘汰数据（不删除直到写满时报错）

六、常见的 Redis 问题

缓存雪崩
1.1 问题描述
缓存同一时间大面积的过期失效，所以，后面的请求都会落到数据库上，造成数据库短时间内承受大量请求而崩掉。

1.2 解决方案
①缓存数据的过期时间设置随机，防止同一时间大量数据过期现象发生。
②一般并发量不是特别多的时候，使用最多的解决方案是加锁排队。
③给每一个缓存数据增加相应的缓存标记，记录缓存的是否失效，如果缓存标记失效，则更新数据缓存。
缓存击穿
2.1 问题描述
①缓存中没有但数据库中有的数据（一般是缓存时间到期），这时由于并发用户特别多，同时读缓存没读到数据，又同时去数据库去取数据，引起数据库压力瞬间增大，造成过大压力。
②和缓存雪崩不同的是，缓存击穿指并发查同一条数据，缓存雪崩是不同数据都过期了，很多数据都查不到从而查数据库。
2.2 解决方案
①设置热点数据永远不过期。
②加互斥锁，互斥锁。
缓存穿透
3.1 问题描述
①缓存和数据库中都没有的数据，导致所有的请求都落到数据库上，造成数据库短时间内承受大量请求而崩掉。

3.2 解决方案
①接口层增加校验，如用户鉴权校验，id做基础校验，id<=0的直接拦截；
②从缓存取不到的数据，在数据库中也没有取到，这时也可以将 key-value 对写为 key-null，缓存有效时间可以设置短点，如30秒（设置太长会导致正常情况也没法使用）。这样可以防止攻击用户反复用同一个id暴力攻击。
③采用布隆过滤器，将所有可能存在的数据哈希到一个足够大的 bitmap 中，一个一定不存在的数据会被这个 bitmap 拦截掉，从而避免了对底层存储系统的查询压力。
缓存和数据库双写一致性问题
4.1 读取数据
①先从Redis中读取，如果Redis中没有，再从MvSQL中读取，并将读取到的数据写入到Redis缓存中。这样，下次读取该数据时就可以从Redis中直接获取，避免了直接访问MySQL数据库，提高了读取速度
4.2 更新数据
①先更新MySQL数据库，再更新Redis缓存。这样，即使Redis缓存出现了异常，MySQL中的数据仍然是正确的，避免了数据不一致的问题。如果Redis更新失败，可以选择记录日志并进行重试，直到更新成功为止
4.3 删除数据
①同样需要先删除Redis缓存，再删除MvSQL数据库。这样可以保证删除操作的原子性，避免了可能的数据不一致。
4.4 关键数据
①对于一些关键数据，可以使用MVSQL的触发器(Trigger) 来实现同步更新Redis缓存。当MySQL中的数据发生变化时，触发器可以自动将变化同步到Redis中，避免了手动操作的疏漏。
4.5 定期同步数据
①定期同步MySQL和Redis中的数据，以确保数据的一致性。可以使用定时任务或者其他方式定期同步两个数据源中的数据，从而保持致。

总的来说就是先更新数据库，然后再删除缓存 + 缓存做过期时间，数据过期后再有读请求可从数据库直接更新缓存。

总结

容灾的概念
就是在自然灾害、设备故障、人为操作破坏等的灾难发生时，在保证生产系统的数据尽量少丢失的情况下，保持生存系统的业务不间断地运行。
RDB 和 AOF 的区别
redis优化
（1）设置 config set activedefrag yes 开启内存碎片自动清理，或者定时执行 memory purge 清理内存碎片；
（2）设置 maxmemory 指定redis占用最大内存大小，设置 maxmemory-samples 指定内存数据淘汰策略的样本数量；
（3）设置内存数据淘汰策略 maxmemory-policy 实现保证内存使用率不超过最大内存大小；
（4）设置 key 的过期时间，精简键名和键值，及控制键值的大小；
（5）尽可能使用 Hash 数据类型存储数据，因为 Hash 类型的一个键包含多个字段，该类型的数据占用空间较小；
（6）合理设置 maxclients 最大客户端连接数，tcp-backlog tcp监控端口的最大连接排队数， timeout 连接超时时间；
（7）设置 AOF 持久化和主从复制备份数据，采用哨兵或者集群模式实现高可用；
（8）设置 config set requirepass 开启密码验证。