上一篇:Redis 系列10--Redis HyperLogLog_fengxianaa的博客-CSDN博客
Redis 是内存数据库,但是也提供数据的持久化功能,分别是:RDB 和 AOF
- RDB :redis database backup,就是对内存中的数据周期性的备份到硬盘上,当redis故障重启后,从硬盘上读取备份文件,恢复数据
- AOF:Append only file,记录每一条写指令,redis重启时候,通过AOF日志中的写指令来重构整个数据集
1. RDB
手动RDB的命令有两个
- save:阻塞 Redis 主进程,直到保存完成。在阻塞期间,服务器不能处理客户端的任何请求
- bgsave:新建一个子进程负责调用 rdbSave ,并在保存完成之后向主进程发送信号,通知保存已完成。 Redis 服务器在BGSAVE 执行期间仍然可以继续处理客户端的请求
1. 主要配置
# 空字符串 表示禁止RDB功能
save ""
# 每隔 5s,如果有1个key发上变更,就生成一个新的dump.rdb文件
save 5 1
# 每隔 300s,如果有100个key发上变更,就生成一个新的dump.rdb文件
save 300 100
# save可以设置多个,就是多个检查点,每到一个检查点,就会去check一下,
# 是否有指定的key数量发生了变更,如果有,就生成一个新的dump.rdb文件
# 是否要锁,建议不开启,压缩会消耗cpu
rdbcompression yes
# RDB 文件名
dbfilename dump.rdb
# 文件路径
dir /root/soft/redis/db/6379
2. 效果
按照上图的配置,看一下效果
上图,设置了一个key,可以看到日志上已经生成rdb文件
3. 流程
- fork一个子进程出来,
- 子进程尝试将数据dump到临时的rdb快照文件中
- 完成rdb快照文件的生成之后,就替换之前的旧的快照文件
注意:dump.rdb,每次生成一个新的快照,都会覆盖之前的老快照
4. 缺点
- 一般来说,RDB数据快照文件,都是每隔5分钟,或者更长时间生成一次,这个时候就得接受一旦redis进程宕机,那么会丢失最近5分钟的数据
- fork子进程来执行RDB快照数据文件生成的时候,如果数据文件特别大,会很耗时
2. AOF
AOF持久化,默认是关闭的
1. 主要配置
# 是否开启aof,默认是no
appendonly yes
# aof文件名
appendfilename "appendonly.aof"
# 指令的记录频率
# 每次写入一条数据,立即记录,性能非常差,吞吐量很低; 确保说redis里的数据一条都不丢,那就只能这样了
#appendfsync always
# 指令先放入aof缓存区,然后每秒把缓冲区的数据写到aof文件中,默认方案
appendfsync everysec
# 将数据写入缓冲区就撒手不管了,操作系统决定何时将数据刷入磁盘,不可控,可能丢失大量数据
#appendfsync no
2. 效果
再次执行set指令
重启redis
查看日志会发现,加载aof文件,初始化缓存数据
注意:如果同时有rdb和aof,那么redis会选择加载aof文件来初始化数据,因为aof的数据更加完整
3. aof重写
因为是记录命令,所以aof文件会越来越大,而且对一个key的多次写操作都会记录,但只有最后一次才有意义,所以redis提供aof重写功能,比如:日志里已经存放了100w的写日志了; redis内存只剩下10万; 基于内存中当前的10万数据构建一套最新的日志,到AOF中; 覆盖之前的老日志; 确保AOF日志文件不会过大,保持跟redis内存数据量一致
重写策略
# aof文件比上次增加指定百分比,就重写
auto-aof-rewrite-percentage 100
# aof文件最小多大才重写
auto-aof-rewrite-min-size 64mb
比如说上一次AOF rewrite之后,是128mb
然后就会接着128mb继续写AOF的日志,如果发现增长的比例,超过了之前的100%,达到256mb,就可能会去触发一次rewrite,但是此时还要去跟min-size,64mb去比较,256mb > 64mb,才会去触发rewrite
4. 流程
(1)redis fork一个子进程
(2)子进程基于当前内存中的数据,构建日志,开始往一个新的临时的AOF文件中写入日志
(3)redis主进程,接收到client新的写操作之后,在内存中写入日志,同时新的日志也继续写入旧的AOF文件
(4)子进程写完新的日志文件之后,redis主进程将内存中的新日志再次追加到新的AOF文件中
(5)用新的日志文件替换掉旧的日志文件
3. RBD、AOF 对比
1)不要仅仅使用RDB,因为那样会导致你丢失很多数据
2)也不要仅仅使用AOF,因为那样有两个问题,
第一,你通过AOF做冷备,没有RDB做冷备恢复速度更快;
第二,RDB每次简单粗暴生成数据快照,更加健壮,可以避免AOF这种复杂的备份和恢复机制的bug
3)综合使用AOF和RDB两种持久化机制,用AOF来保证数据不丢失,作为数据恢复的第一选择;
用RDB来做不同程度的冷备,在AOF文件都丢失或损坏不可用的时候,还可以使用RDB来进行快速的数据恢复