Redis持久化
Redis系列笔记跟着B站up狂神说学习,所有笔记照着敲了一遍,记录下来供后续忘了参考。
一、NoSQL简介
二、Redis入门–配置安装等
三、Redis数据类型(重要)
四、Redis事务
五、Jedis使用
六、SpringBoot整合Redis
七、Redis持久化
面试重点
RDB
什么是rdb
在主从复制中,rdb是备用的
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存里。
Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的。这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。我们默认的就是RDB,一般情况下不需要修改这个配置!
rdb保存的文件是dump.rdb ,都是在我们的配置文件中进行配置的!
有时候在生产环境,我们会对该文件进行备份
# The filename where to dump the DB
dbfilename dump.rdb
生成了.rdb文件之后,关机了再次开启,数据被持久化了,可以进行使用。
触发机制
- save的规则满足的情况下,会自动触发rdb规则
- 执行flushallin命令,也会触发rdb规则
- 退出redis,也会产生rdb文件
恢复rdb文件
- 只需要将rdb文件放在我们redis启动目录就可以,redis启动的时候会自动检查dump.rdb,恢复其中的数据
- 查看需要存在的位置:
config get dir
优点:
- 适合大规模的数据恢复
- 对数据的完整性要求不高
缺点:
- 需要一定的时间间隔进程操作,如果redis意外崩溃了,最后一次修改的数据就不会生效
- fork进程的时候,会占用一定的内存空间
AOF(Append Only File)
将我们所有的命令都记录下来,history,恢复的时候把这个文件全部再执行一遍!
- 以日志的形式来记录每个写操作,将Redis执行过的所有指令记录下来(读操作不记录),只许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据,redis重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。
- AOF保存的文件是
appendonly.aof
文件,默认是不开启的,需要手动设置开启appendonly no
改为yes
redis-check-aof --fix aof
文件:用来修复这个aof文件
优点:
- 每一次修改都同步,文件的完整性会更好
- 每秒同步一次,可能会丢失一秒的数据
- 从不同步,效率是最高的
缺点:
- 相对于数据文件来说,
aof
文件远远大于rdb
,修复的数据也比rdb
慢,因此redis
默认的是rdb
。 aof
运行效率也要比rdb
慢
扩展:
- RDB 持久化方式能够在指定的时间间隔内对你的数据进行快照存储
- AOF 持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以Redis 协议追加保存每次写的操作到文件末尾,Redis还能对AOF文件进行后台重 写,使得AOF文件的体积不至于过大。
- 只做缓存,如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化
- 同时开启两种持久化方式
- 在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF 文件保存的数据集要比RDB文件保存的数据集要完整。
- RDB 的数据不实时,同时使用两者时服务器重启也只会找AOF文件,那要不要只使用AOF呢?作者建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),快速重启,而且不会有 AOF可能潜在的Bug,留着作为一个万一的手段。
性能建议:
- 因为RDB文件只用作后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够 了,只保留 save 900 1 这条规则。
- 如果Enable AOF ,好处是在恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只load自 己的AOF文件就可以了,代价一是带来了持续的IO,二是AOF rewrite 的后将 rewrite 过程中产 生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite 的频率,AOF重写的基础大小默认值64M太小了,可以设到5G以上,默认超过原大小100%大小重 写可以改到适当的数值。
- 如果不Enable AOF ,仅靠 Master-Slave Repllcation 实现高可用性也可以,能省掉一大笔IO,也 减少了rewrite时带来的系统波动。代价是如果Master/Slave 同时挂掉(断电),会丢失十几分钟的数据, 启动脚本也要比较两个 Master/Slave 中的 RDB文件,载入较新的那个,微博就是这种架构。