Redis持久化之RDB
哪里会有人喜欢孤独,不过是不喜欢失望罢了。
一、RDB简介
在指定时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存里。
Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。
注:Fork的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等)数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程
二、触发方式(默认RDB文件名称:dump.rdb)
1.手动触发
1).执行save命令后(save命令只管保存,会阻塞进程)
2).执行bgsave命令后(异步执行快照操作,对客户端请求无影响,可通过lastsave命令获取最后一次成功执行快照的时间)
3).执行flushall命令后(会产生空的dump.rdb文件,因此无意义)
4).执行shutdown命令后
2.自动触发
配置 redis.conf 文件中 SNAPSHOTTING 下的属性。
三、如何恢复快照中的数据
将备份文件 (dump.rdb)移动到redis安装目录并启动服务即可,redis就会自动加载文件数据至内存了。Redis 服务器在载入RDB文件期间,会一直处于阻塞状态,直到载入工作完成为止。
获取 redis 的安装目录可以使用 config get dir 命令
四、如何停止RDB持久化
有些情况下,我们只想利用Redis的缓存功能,并不像使用Redis的持久化功能,那么这时候我们最好停掉 RDB 持久化来最大化Redis性能。
1).在redis.conf配置文件中,注释掉所有的 save 行来停用RDB功能或者直接一个空字符串来实现停用:save “”
2).通过命令config set save “” 停用RDB功能。
五、总结
1.劣势
1).RDB是在一定间隔时间做一次备份,所以如果Redis服务意外停止的话就会丢失最后一次快照的所有修改。
2).数据丢失的风险大,对数据完整性和一致性要求不高。
3).RDB方式数据没办法做到实时持久化/秒级持久化。因为bgsave每次运行都要执行fork操作创建子进程,属于重量级操作(内存中的数据被克隆了一份,大致2倍的膨胀性需要考虑),当数据集比较大的时候,fork的过程是非常耗时的,频繁执行成本过高(影响性能),可能会导致Redis在一些毫秒级不能响应客户端请求。
4).RDB文件使用特定二进制格式保存,Redis版本演进过程中有多个格式的RDB版本,存在老版本Redis服务无法兼容新版RDB格式的问题(版本不兼容)
2.优势
1).RDB是一个非常紧凑(compact)的文件,它保存了Redis在某个时间点上的数据集。这种文件非常适合用于进行备份和灾难恢复。
2).RDB在恢复大数据集时的速度比 AOF 的恢复速度要快。
3).生成RDB文件的时候,Redis主进程会fork()一个子进程来处理所有保存工作,主进程不需要进行任何磁盘IO操作,所以RDB持久化方式可以最大化Redis性能。