1. 什么是redis的持久化?
Redis 是一款内存数据库,也就是说它把数据都存储在内存中,持久化就是把内存中的数据存储到电脑的磁盘上。
Redis 提供了不同级别的持久化方式:
- RDB 持久化方式能够在指定的时间间隔能对你的数据进行快照存储。
- AOF 持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据。
本篇介绍第一种:RDB。
2. RDB(Redis DataBase)
2.1 RDB是什么?
RDB 是 Redis 持久化到磁盘上的数据文件的格式,重点内容默认的文件名是 dump.rdb。
Redis 会在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存里。
Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。当子进程写入完所有数据后会用该临时文件替换旧的RDB文件,至此,一次快照操作完成。
redis在进行快照的过程中不会修改RDB文件,只有快照结束后才会将旧的文件替换成新的,也就是说任何时候RDB文件都是完整的。 这就使得我们可以通过定时备份RDB文件来实现redis数据库的备份, RDB文件是经过压缩的二进制文件,占用的空间会小于内存中的数据,更加利于传输。
整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。
2.2 Fork的作用是什么?
- fork的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等)。
- 数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程。
- 子进程做数据得持久化,不会修改现有得数据结构,它知识对数据结构进行遍历读取,然后序列化写到磁盘中。
2.3 如何手动将 redis 中的数据写入磁盘?
使用 save 命令,或者 bgsave 命令。
- save:该命令会阻塞其他操作,例:客户端请求。
- bgsave:该命令会在后台异步执行写操作,仍然可以处理客户端请求。
- lastsave:该命令获取最后一次成功执行快照的时间。
- flushall / flushdb:清库命令,也会刷新 dump.rdb(这种毫无意义)。
2.4 如何从RDB文件中加载数据?
Redis 在启动的时候会自动加载 redis-server 所在的目录下的 dump.rdb 文件(如果存在的话),如果在启动 redis-server 服务的时候指定了别的配置文件,那就读取那个指定的配置文件目录下的 dump.rdb,例:
redis-server /myconf/redis.conf 命令执行之后就会去加载 /myconf 目录下的 dump.rdb 文件来初始化 redis。
so,我们的运维人员就可以通过定期备份 dump.rdb 文件的方式来防止数据的丢失。
2.5 RDB 的优势
- 适合大规模的数据恢复。
2.6 RDB 的劣势
- 在一定间隔时间做一次备份,所以如果redis意外down掉的话,就会丢失最后一次快照后的所有修改。
- fork的时候,内存中的数据被克隆了一份,大致2倍的膨胀性需要慎重考虑。
2.7 如何令 redis 停止写 RDB 文件?
- 在配置文件中配置 save " "
- 在客户端执行命令:redis-cli config set save ""
2.8 总结