redis持久化
Redis是内存数据库,如果不将内存中的数据库状态保存到磁盘,那么服务进程退出,服务器中的数据库状态也会消失,所以Redis提供了持久化功能。
redis提供了如下两种持久化:
一:RDB持久化
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是Snapshot快照,他恢复时是将快照文件直接读到内存里。
redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进程任何IO操作的。这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。默认方式就是RDB,一般情况不需修改这个配置。
rdb保存的文件是dump.rdb
触发机制:
1.配置中save的规则满足的情况下,会自动触发rdb规则
2.执行flushall命令,也会触发我们的rdb规则
3.退出redis,也会产生rdb文件
持久化就会自动生成一个dump.rdb
如何恢复rdb文件:
1.只需要将rdb文件放在我们redis启动目录就可以了,redis启动的时候会自动检查dump.rdb恢复其中的数据。
2.命令查看存放位置
127.0.0.1:6379> config get dir
1) "dir"
2) "/usr/local/redis-6.2.11/bin" #如果在该目录下存在dump.rdb文件,启动就会自动恢复其中的数据
127.0.0.1:6379>
rdb优点:
1.适合大规模的数据恢复
2.对数据的完整性要求不高
rdb缺点:
1.需要一定的时间间隔进行操作,如果redis意外宕机,这最后一次修改的数据就没有了
2.fork进程的时候,会占用一定的内存空间
二:AOF持久化
aof持久化即将redis所有的非读命令记录下来,恢复的时候就把这个文件中命令全部执行一遍。
以日志的形式来记录每个写操作,将redis执行过的所有指令记录下来(读操作不记录),只许追加文件但不可以改写文件,redis启动之初会读取该文件重新构建数据,即redis重启的话就根据日志文件的内容将写指令从前到后执行一次来完成数据的恢复。
Aof保存的是appendonly.aof文件
AOF持久化默认是关闭的,如需开启在配置文件中将appendonly改为yes,然后保存文件后重启redis即可。
如果这个aof文件中有错误,这个时候redis是无法启动的,我们需要修复这个aof文件,redis在bin目录下提供了一个工具,在bin下执行如下即可:
redis-check-aof --fix appendonly.aof
重写规则:
aof默认就是文件的无限追加,文件会越来越大
如果aof文件大于64mb,就会新建一个进程来将aof文件进行重写。
优缺点:
# 配置持久化同步sync的选项(持久化策略),默认是everysec每秒同步一次
# 每次修改都会同步sync ,这种方式比较耗性能
# appendfsync always
# 每一秒执行一次同步sync,可能会丢失这1s的数据。
appendfsync everysec
# 不执行同步sync,这个时候操作系统自己同步数据,速度最快。
# appendfsync no
优点:
1.每一次修改都同步,文件的完整性会更好。
2.每秒同步一次,可能会丢失一秒的数据
3.从不同步,效率最高
缺点:
1.相对于数据文件来说,aof远远大于rdb,修复速度比rdb慢
2.aof运行效率也比rdb慢,所以redis默认配置就是rdb持久化
三:扩展
1.RDB持久化方式能够在指定的时间间隔内对数据进行快照存储
2.AOF持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以redis协议追加保存每次写的操作到文件末尾,redis还能对AOF文件进行后台重写,使得AOF文件的体积不至于过大。
3.只做缓存,如果只希望数据在服务器运行的时候存在,也可以不使用任何持久化
4.同时开启两种持久化方式
- 在这种情况下,当redis重启的时候会优先载入AOF文件来恢复原始数据,因为在通常情况下AOF文件保存的数据集比RDB文件保存的数据集要完整。
- RDB的数据不实时,同时使用两者时服务器重启也只会找AOF文件,那要不要只使用AOF?建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份),能快速重启,而且不会有AOF可能潜在存在的BUG,留着作为一个万一的手段。
5.性能建议
- 因为RDB文件只用作后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够了,只保留save 900 1这条规则
- 如果Enable AOF,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只load自己的AOF文件就可以了,代价一是带来了持续的IO,二是AOF rewrite 的最后将rewrite过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite的频率,AOF重写的基础大小默认值64M太小了,可以设到5G以上,默认超过原大小100%大小重写可以改到适当的数值。
- 如果不Enable AOF,仅靠Master-Slave Repllcation实现高可用性也可以,能省掉一大笔IO,也减少了rewrite时带来的系统波动。代价是如果Master/Slave同时宕掉,会丢失十几分钟的数据,启动脚本也要比较两个Master/Slave中的RDB文件,载入较新的那个,微博即是这种架构。