Redis持久化
RDB持久化
RDB全称Redis Database Backup file(Redis数据备份文件),也被叫做Redis数据快照。简单来说就是把内存中的所有数据都记录到磁盘中。当Redis实例故障重启后,从磁盘读取快照文件,恢复数据。快照文件称为RDB文件,默认是保存在当前运行目录。
执行RDB时机
RDB持久化在四种情况下会执行:
- 执行save命令
- 执行bgsave命令
- Redis停机时
- 触发RDB条件时
执行save
命令,可以立即执行一次RDB,save
命令会导致主进程执行RDB,这个过程中其它所有命令会被阻塞。
127.0.0.1:6666> save
OK
执行bgsave
命令,可以开启子进程异步完成RDB,主进程可以持续处理客户端请求不受影响
127.0.0.1:6666> bgsave
Background saving started
停止Redis服务时也会执行一次save,实现RDB持久化
systemctl stop redis
触发RDB条件,Redis内部有触发RDB的机制,可以在redis.conf文件中找到,格式如下:
# 900秒内,如果至少有1个key被修改,则执行bgsave , 如果是save "" 则表示禁用RDB
save 900 1
# 300秒内,如果至少有10个key被修改
save 300 10
# 60秒内,如果至少有10000个key被修改
save 60 10000
# 关闭RDB
save ""
RDB的其它配置也可以在redis.conf文件中设置:
# 是否压缩 ,建议不开启,压缩也会消耗cpu,磁盘的话不值钱
rdbcompression yes
# RDB文件名称
dbfilename dump.rdb
# 文件保存的路径目录
dir ./
RDB 原理
每个进程操作的其实是虚拟地址空间,也就是操作的是虚拟内存,通过操作系统提供的页表来完成虚拟内存和物理内存的映射。
bgsave开始时会fork主进程得到子进程,子进程会复制主进程的页表来对物理内存进行操作。注意主进程创建子进程这个过程会导致阻塞,无法接收客户端其它命令,当得到子进程后就可以继续接收客户端的命令并执行了。
那么问题来了,主进程在对数据进行写的时候,子进程还能进行RDB拷贝吗?其实是可以的,
fork采用的是copy-on-write(写时复制)技术:
- 主进程每次写操作都会将原来的数据先复制一份再进行写操作,并不会影响子进程RDB
- 那么在极端情况下RDB时间比较久,而主进程一直对数据进行写操作,导致所有数据都复制一遍,从而导致内存翻倍,所以要给Redis预留一部分内存空间,保证RDB正常拷贝
- 在写时复制的时候持久化到磁盘的时候,如果数据发生改变,保存到磁盘的是未修改的数据,修改完毕的数据要下次bgsave才能持久化到磁盘
小结
RDB方式bgsave的基本流程?
- fork主进程得到一个子进程,共享内存空间
- 子进程读取内存数据并写入新的RDB文件
- 用新RDB文件替换旧的RDB文件
RDB会在什么时候执行?save 60 1000代表什么含义?
- 代表60秒内至少执行1000次修改则触发RDB
- 如果在这60秒内没有修改到1000次,服务器直接断电了,那么这些数据就会丢失无法持久化
RDB的缺点?
- RDB执行间隔时间长,两次RDB之间写入数据有丢失的风险
- fork子进程、压缩、写出RDB文件都比较耗时
AOF 持久化
AOF全称为Append Only File(追加文件)。Redis处理的每一个写命令都会记录在AOF文件,可以看做是命令日志文件。
AOF配置
AOF默认是关闭的,需要修改redis.conf配置文件来开启AOF:
# 是否开启AOF功能,默认是no
appendonly yes
# AOF文件的名称
appendfilename "appendonly.aof"
AOF的命令记录的频率也可以通过redis.conf文件来配:
建议使用默认方案,性能和可靠性的折中
# 表示每执行一次写命令,立即记录到AOF文件
appendfsync always
# 写命令执行完先放入AOF缓冲区,然后表示每隔1秒将缓冲区数据写到AOF文件,是默认方案
appendfsync everysec
# 写命令执行完先放入AOF缓冲区,由操作系统决定何时将缓冲区内容写回磁盘
appendfsync no
AOF重写
因为AOF是把所有命令给记录起来,就会存在很多没有意义的命令,比如说对同一个key进行多次写前面的写命名就没有意义了,大量冗余的命令就会导致相比RDB文件AOF文件也会大许多。
通过执行bgrewriteaof
命令,可以让AOF文件执行重写功能,用最少的命令达到相同效果。
127.0.0.1:6666> bgrewriteaof
Background append only file rewriting started
Redis也会在触发阈值时自动去重写AOF文件。阈值也可以在redis.conf中配置:
# AOF文件比上次文件 增长超过多少百分比则触发重写
auto-aof-rewrite-percentage 100
# AOF文件体积最小多大以上才触发重写
auto-aof-rewrite-min-size 64mb
RDBvsAOF
RDB和AOF各有自己的优缺点,如果对数据安全性要求较高,在实际开发中往往会结合两者来使用。
RDB | AOF | |
---|---|---|
持久化方式 | 定时对整个内存做快照 | 记录每一次执行的命令 |
数据完整性 | 不完整,两次备份之间可能会有数据丢失 | 相对完整,取决于刷盘策略 |
文件大小 | 会有压缩,文件体积小 | 记录命令,文件体积很大 |
宕机恢复速度 | 很快 | 慢 (通过命令恢复) |
数据恢复优先级 | 低,因为数据完整性不如AOF | 高,因为数据完整性更高 |
系统资源占用 | 高,大量CPU和内存消耗 | 低,主要是磁盘IO资源,但AOF重写时会占用大量CPU和内存资源 |
使用场景 | 可以容忍分钟的数据丢失,追求更快的启动速度 | 对数据安全性要求较高 |
其实如果能容忍一定的数据丢失使用RDB追求速度其实是可以的,如果不能那么久可以使用AOF。