一. 持久化简介
1. 什么是持久化
利用永久性存储介质将数据进行保存, 在特定的时间将保存的数据进行恢复的工作机制称为持久化
2.为什么要进行持久化
防止数据的意外丢失, 确保数据安全性
3. 持久化过程保存什么
- 将当前数据状态进行保存,快照形式, 存储数据结果,存储格式简单,关注点在数据
- 将数据的操作过程进行保存, 日志形式, 存储操作过程, 存储格式复杂, 关注点在数据的操作过程
二. RDB
1. RDB启动方式
(1) save指令
1> save指令
- 命令
save
- 作用
手动执行一次保存操作
2> save指令工作原理
注意: save指令的执行会阻塞当前Redis服务器, 直到当前RDB过程完成为止,有可能会造成长时间阻塞, 线上环境不建议使用.
3> save指令相关配置
-
dbfilename dump.rdb
说明: 设置本地数据库文件名, 默认值为dump.rdb
经验: 通常设置为 dump-端口号.rdb -
dir
说明: 设置存储.rdb文件的路径
经验: 通常设置成存储空间较大的目录中, 目录名称为 data -
rdbcompression yes
说明: 设置存储至本地数据库时是否压缩数据, 默认为 yes , 采用LZF压缩
经验: 通常默认为开启状态, 如果设置为no, 可以节省CPU运行时间, 但会使存储的文件变大(巨大) -
rdbchecksum yes
说明: 设置是否进行RDB文件格式校验, 该校验过程在写文件和读文件过程均进行
经验: 通常默认为开启状态, 如果设置为no, 可以节约读写性过程约10%时间消耗, 但存储一定的数据损坏风险
(2) bgsave指令
1> 启动命令
- 命令
bgsave
- 作用
手动启动后台保存操作, 但不是立即执行
2> bgsave指令工作原理
注意: bgsave命令是针对save阻塞问题做的优化. Redis内部所有涉及到RDB操作都采用bgsave的方式, save命令可以放弃使用.
3> bgsave指令相关配置
(3) save配置
注意:
- save配置要根据实际业务情况进行设置, 频度过高或过低都会出现性能问题, 结果可能是灾难性的
- save配置中对于second与changes设置通常具有互补对应关系, 尽量不要设置成包含性关系
- save配置启动后执行的是bgsave操作
(4) RDB其他启动方式
2. RDB三种启动方式对比
save配置执行的是bgsave操作
3. RDB的优缺点
(1)RDB的优点
- RDB是一个紧凑压缩的二进制文件, 存储效率较高
- RDB内部存储的是redis在某个时间点的数据快照,非常适合用于数据备份,全量复制等场景
- RDB恢复数据的速度要比AOF快很多
- 应用: 服务器中每X小时执行bgsave备份, 并将RDB文件拷贝到远程机器中, 用于灾难恢复
(2)RDB的缺点
- RDB方式无论是执行指令还是利用配置,无法做到实时持久化, 具有较大的可能性丢失数据
- bgsave指令每次运行都要执行fork操作创建子进程, 要牺牲掉一些性能
- Redis的众多版本中未进行RDB文件格式的版本统一,有可能出现各版本服务之间数据格式无法兼容现象
三.AOF
1. AOF简介
(1)RDB存储的弊端
- 存储数据量较大, 效率较低. 基于快照思想,每次读写都是全部数据, 当数据量巨大时,效率非常低
- 大数据量下的IO性能较低
- 基于fork创建子进程, 内存产生额外消耗
- 宕机带来的数据丢失风险
解决思路
- 不写全数据,仅记录部分数据
- 改记录数据为记录操作过程
- 对所有操作均进行记录,排除丢失数据的风险
(2) AOF概念
- AOF(append only file) 持久化: 以独立日志的方式记录每次写命令, 重启时再重新执行AOF文件中的命令, 达到恢复数据的目的. 与RDB相比可以简单描述为 改记录数据为记录数据产生的过程
- AOF的主要作用是解决了数据持久化的实时性, 目前已经是Redis持久化的主流方式
2. AOF持久化策略基本操作
(1)AOF写数据过程
(2)AOF写数据三种策略(appendfsync)
-
always(每次)
每次写入操作均同步到AOF文件中, 数据零误差, 性能较低, 不建议使用 -
everysec(每秒)
每秒将缓冲区中的指令同步到AOF文件中, 数据准确性较高, 性能较高, 建议使用, 也是默认配置. 在系统突然宕机的情况下丢失1秒内的数据 -
no(系统控制)
由操作系统控制每次同步到AOF文件的周期, 整体过程不可控
(3)AOF功能开启
- 配置
appendonly yes|no
- 作用
是否开启AOF持久化功能, 默认为不开启状态 - 配置
appendfsync always|everysec|no
- 作用
AOF写数据策略
(4)AOF相关配置
- 配置
appendfilename filename
-
作用
AOF持久化文件名, 默认文件名为appendonly.aof, 建议配置为 appendonly-端口号.aof -
配置
dir
- 作用
AOF持久化文件保存路径,与RDB持久化保持一致即可
3. AOF重写概念与命令执行
(1)AOF重写
随着命令不断写入AOF, 文件会越来越大, 为了解决这个问题, redis引入了AOF重写机制压缩文体积. AOF文件重写是将Redis进程内的数据转换为写命令同步到新AOF文件的过程. 简单说就是将同一个数据的若干个条命令执行结果转换为最终结果数据对应的指令进行记录.
作用
- 降低磁盘占用量,提高磁盘利用率
- 提高持久化效率,降低持久化写时间,提高IO性能
- 降低数据恢复用时, 提高数据恢复效率
(2)AOF重写规则
- 进程内已超时的数据不再写入文件
- 忽略无效指令, 重写时使用进程内数据直接生成,这样新的AOF文件只保留最终数据的写入命令
如del key1 , hdel key2 , srem key3 , set key4 111 等 - 对同一数据的多条命令合并为一条命令
如 lpush list1 a , lpush list1 b ,lpush list1 c 可以转换为 lpush list1 a b c
为防止数据量过大造成客户端缓冲区溢出, 对list , set , hash , zset 等类型, 每条指令最多写入64个元素
(3)AOF重写方式
- 手动重写
bgrewriteaof
- 自动重写
auto-aof-rewrite-min-size size
auto-aof-rewrite-percentage percentage
(4)AOF手动重写 ---- bgrewriteaof指令工作原理
4. AOF自动重写方式
- 自动重写触发条件设置
auto-aof-rewrite-min-size size //自动aof重写的最小尺寸
auto-aof-rewrite-percentage percent //自动增量重写的百分比
- 自动重写触发比对参数(运行指令info Persistence获取具体信息)
aof_current_size //当前尺寸
aof_base_size //基础尺寸
- 自动重写触发条件
//当前的大小超过了配置的重写尺寸,进行重写
aof_current_size>auto-aof-rewrite-min-size
5. AOF重写工作原理
AOF工作流程