数据持久化
RDB (Redis DataBase)
在指定的时间间隔内将内除中的数据集快照写入磁盘,即Snapshot快照。
备份如何执行
Redis会单独创建(fork)一个子进程来执行持久化,会先将数据写入到一个临时文件,待持久化过程结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不及逆行任何IO操作的,这就确保了极高的性能。如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那么RDB方式要比AOF方式更加高效。
RDB缺点是最后一次持久化的数据可能丢失
Fork
-
For的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等)数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程
-
在Linux程序中,fork会产生一个和父进程完全相同的进程,但是子进程在此后多会exec系统调用,出于效率考虑,Linux引入了“写时复制技术”
-
一般情况下父进程和子进程会公用同一段物理内存,只有进程空间的各段的内容要发生变化时,才会将父进程的内容复制给子进程
RDB持久化流程
dump.rdb文件
在redis中配置文件名称,默认为dump.rdb
配置位置
rdb文件的保存路径,也可以修改。默认为Redis启动时命令行所在的目录 dir ./
配置文件中默认的快照配置
命令 save 和 bgsave
save:save时只管保存,其它不管,全部阻塞。手动保存。
bgsave:Redis会在后台异步进行快照操作,快照同时还可以响应客户端请求。可以通过lastsave命令获取最后一次成功执行快照的时间
flushall
执行 flushall 命令,也会产生dump.rdb文件,但是内容为空。
SNAPSHOTTING快照
SAVE
格式:save 秒 写操作的次数
RDB是整个内存压缩过的Snapshot RDB数据结构,可以配置复合的快照触发条件
默认是1分钟内改了1万次 / 5分钟内改了10次 / 15分钟内改了1次
- 禁用:不设置save指令,或者给save传入空字符串
stop-write-on-bgsave-error
当Redis无法写入磁盘的话,直接关掉Redis的写操作。 推荐 yes
rdbcompression压缩文件
对于存储到磁盘中的快照,可以设置是否进行压缩存储。如果为yes,Redis会采用LZF算法进行压缩。
rdbchecksum检查完整性
在存储快照后,还可以让redis采用CRC64算法来进行数据校验,但是会增加大约10%的性能消耗。
RDB的备份
先通过 conf get dir 查询到 rdb文件目录
将 *.rdb 的文件拷贝到别的地方
rdb的恢复:
- 关闭Redis
- 先把备份的文件拷贝到工作目录 cp dump.rdb.bak dump.rdb
- 启动Redis,备份数据会直接加载
优势
- 适合大规模的数据恢复
- 对数据的完整性和一致性要求不高更适合使用
- 节省空间
- 恢复速度快
劣势
- Fork的时候,内存中的数据被克隆了一份,大约2倍的数据膨胀
- 虽然Redis在Fork时使用了 写时复制技术,但是如果数据庞大时还是比较消耗性能
- 在备份周期一定间隔时间做一次备份,所以如果Redis意外down掉,就会失去最后一次快照后的所有修改
停止
动态停止 RDB: redis-cli config set save “” # save后给空值,表示禁用保存策略
AOF(Append Only File)
以日志的形式来记录每个写操作(增量保存),将Redis执行过的所有写指令记录下来,只许追加文件但不可以改写文件,reids启动之初会读取该文件重新构建数据。redis重启就会根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作
AOF持久化流程
- 客户端请求会被append追加到AOF缓冲区内
- AOF缓冲区根据AOF持久化策略[always、everysec、no]将操作sync同步到磁盘的AOF文件中
- AOF文件大小超过重写策略或手动重写时,会对AOF文件rewrite重写,压缩AOF文件容量
- Redis服务重启时,会重新load加载AOF文件中的写操作达到数据恢复的目的
AOF默认不开启
可以在redis.conf中配置文件名称, 默认为appendonly.aof
AOF文件的保存路径同RDB的路径一致
AOF和RDB同时开启
AOF和RDB同时开启,系统默认读取AOF的数据(数据不会丢失)
AOF启动/修复/恢复
- AOF的备份机制和性能虽然和RDB不同,但是备份和恢复的操作同RDB一样,都是拷贝备份文件,需要恢复时再拷贝到Redis的工作目录下,启动系统即加载
- 正常恢复
- 修改默认的appendonly no 为 yes
- 将有数据的aof文件复制一份保存到对应的目录(查看目录 config get dir)
- 恢复:重启Redis后重新加载
- 异常恢复
- 修改默认的appendonly no 为 yes
- 如遇到 AOF文件损坏,通过 /usr/local/bin/redis-check-aof --fix appendonly.aof进行恢复
- 备份被写坏的AOF文件
- 恢复:重启redis然后重新加载
AOF同步频率设置
appendfsync always
始终同步,每次Redis的写入都会立刻记入日志;性能较差但数据完整性较好
appendfsync everysec
每秒同步,每秒计入日志一次,如果宕机,本秒的数据可能丢失
appendfsync no
redis 不主动进行同步,把同步时机交给操作系统
Rewrite压缩
AOF采用文件追加方式,文件会越来越大为避免这种情况,增加了重写机制:当AOF文件的大小超过所设定的阈值时,Redis就会启动AOF的内容压缩,只保留可以恢复数据的最小指令集,可以使用bgrewriteaof
重写原理
AOF文件持续增长而过大时,会fork出一条新进程来将文件重写(也是先写临时文件再rename)。把rdb的快照,以二进制的形式附在新的aof头部,作为已有的历史数据,替换原来的流水操作
no-apendfsync-on-rewrite
如果no-appendfsync-on-rewrite=no,不写入aof文件只写入缓存,用户请求不会阻塞,但是如果在这段时间内宕机则会丢失这段时间内的缓存数据(降低数据安全性,提高性能)
如果no-appendfsync-on-rewrite=no,还是会把数据写入到磁盘,但是遇到重写操作,可能会发生阻塞(数据安全,但是性能降低)
触发机制,何时重写
Redis会记录上次重写时AOF大小,默认配置是AOF文件大小是上次rewrite后大小的一倍且大于64M时触发
重写虽热可以节省大量磁盘空间,减少恢复时间。但是每次重写还是有一定的负担的,因此设定Redis要满足一定条件才会重写
auto-aof-rewrite-pecentage:设置重写的基准值,文件达到100%时开始重写
auto-aof-rewrite-min-size:设置重写的基准值,最小文件64M,达到这个值开始重写
系统载入时或者上次重写完毕时,Redis会记录此时AOF的大小,设为base_size,如果Redis的 AOF当前大小 >= base_size + base_size * 100 %(默认)且当大小>=64M(默认)的情况下,Redis会对AOF进行重写
重写流程
- bgrewriteaof触发重写,判断是否当前有bgsave或bgwriteaof再运行,如果有,则等待该命令结束后再继续执行
- 主进程fork出子进程执行重写操作,保证主进程不会阻塞
- 子进程遍历redis内存中数据到临时文件,客户端的写请求同时写入aof_buf缓冲区和aof_rewrite_buf重写缓冲区保证AOF文件完整以及AOF文件生成期间的新的数据修改动作不会丢失
- 子进程写完新的AOF文件后,向主进程发信号,父进程更新统计信息;主进程把aof_rewrite_buf中的数据写入到新的AOF文件
- 使用新的AOF文件覆盖旧的AOF文件,完成AOF重写
优势
- 备份机制更稳健,丢失书法据概率更低
- 可读的日志文本,通过操作AOF稳健,可以处理误操作
劣势
- 比起RDB占用更多的磁盘空间
- 恢复备份速度要慢
- 每次读写都同步的话,有一定的性能压力
- 存在个别Bug,造成不能恢复
用哪个
官方推荐两个都启用
如果对数据不敏感,可以单独选用RDB
不建议单独用AOF,因为可能出现Bug
如果只是做单纯内存缓存,可以都不用
性能建议
-
因为RDB文件只用作后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够了,只保留save 900 1这条规则。
-
如果使用AOF,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只load自己的AOF文件就可以了。
-
代价,一是带来了持续的IO,二是AOF rewrite的最后将rewrite过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。
-
只要硬盘许可,应该尽量减少AOF rewrite的频率,AOF重写的基础大小默认值64M太小了,可以设到5G以上。默认超过原大小100%大小时重写可以改到适当的数值。