一,基本概念
-
官网介绍
- RDB即Redis DataBase,在指定时间间隔内将内存中的数据集快照写入磁盘,简称快照,它恢复时是将快照文件直接读到内存里,简单理解是指定时间块的数据写入磁盘。
-
Rdb工作过程
- Redis会单独创建(fork)一个子进程来进行持久化,会将数据写入到一个临时文件中,待持久化过程结束,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能,如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,RDB方式要比AOF方式更高效。RDB缺点是最后一次持久化后的数据可能丢失。
- 注意:fork的作用是复制一个与当前进程一样的进程。这个新的进程所有数据与原进程一致,但是是一个全新的进程,并作为原进程的子进程。
- RDB保存的是dump.rdb文件
二,快照文件的配置
-
Save
- save “ ” 表示禁用Rdb快照
- save 秒 键被改变的次数 eg: save 90 5 即:9秒内key被修改5次就进行快照备份,如果90秒没有5次改动则要用save进行存储
- 恢复rdb文件直接把远程的cp回来即可
-
Stop-writes-on-bgsave-error
- 用来保持数据一致性,配置文件中默认是yes
- 如果配置成no,表示数据可以不一致或者其他手段来发现和控制数据一致
-
rdbcompression
- 对于存储到磁盘中的快照,可以设置是否进行压缩存储,如果压缩,redis会采取LZF算法进行压缩,如果不想消耗CPU进行压缩的话,可以设置为关闭此功能
- 默认是yes
-
rdbcheksum
- 在存储快照后,还可以让redis使用CRC64算法来进行数据校验,但是这样会增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能
- 默认是yes
-
dbfilename
- 给dump.rdb快照文件起名字
-
dir
- config get dir 查看路径
三,如何触发RDB快照
- 配置文件中配置快照,如果数据被损坏就cp复制.rdb文件主机考到备机上。
- 命令save 和bgsave都可以迅速形成dump.db文件
- save:只管保存,会阻塞,不能响应客户的请求
- bgsave:redis会在后台异步进行快照操作,快照同时还可以响应客户端的请求。可以通过lastsave命令获取最后一次成功执行快照的时间
- 执行flushall命令,也会产生dump.rdb文件,但里面是空的,无意义
四,恢复数据
- 将备份文件移动到redis安装目录并启动服务即可
五,RDB优点
- 适合大规模数据恢复
- 对数据完整性和一致性要求不高
六,缺点
- 在一定间隔时间做一次备份,所以如果redis意外down掉的话,就会丢失最后一次快照的所有修改文件;
- Fork的时候,内存中的数据被克隆了一份,大致2倍的膨胀性需要考虑内存问题
七,停止rdb
- 动态所有停止RDB保存规则的方法:redis-cli config set save “”
八,总结
- RDB在保存RDB文件时父进程唯一需要做的就是fork出一个子进程,接下来的工作全部由子进程做,父进程不需要再做其他IO操作,所以RDB持久化方式可以最大化redis的性能;
- 与AOF相比,在恢复大的数据集时,RDB方式会更快;
- RDB丢失数据风险大
- RDB需要经常fork子进程来保存数据集到硬盘上,当数据集比较大的时候,fork的过程是非常消耗时间的,可能会导致Redis在一些毫秒级不能响应客户端请求。