前期准备工作
1. 将redis-6.0.6的压缩包上传到服务器中
# 将redis-6.0.6进行解压 解压 tar.gz 格式的文件
tar -xzvf redis-6.0.6.tar.gz
2. 自定义redis数据卷
# 将解压的压缩包中的配置文件复制到将挂载的目录中
cp /usr/local/redis-6.0.6/redis.conf /home/redis/persistence/conf/redis.conf
3.修改配置文件
1.只允许本机访问
1. 将其注释
2. 修改为 0.0.0.0
2.节点端口
3.关闭保护模式
yes -> no
4. 修改密码
5.设置文件产生目录
1. REB(Redis DataBase)
1. RDB的备份机制
在指定的时间间隔内将内存中的数据集快照写入磁盘
Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到 一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。 整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能。
-
如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。
-
RDB的缺点是最后一次持久化后的数据可能丢失。
-
数据如果有变化的,会在/usr/local/bin目录下生成一个dump.rdb的文件
Fork的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等) 数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程。
-
在Linux程序中,fork()会产生一个和父进程完全相同的子进程,但子进程在此后多会exec系统调用,出于效率考虑,Linux中引入了“写时复制技术”
-
一般情况父进程和子进程会共用同一段物理内存,只有进程空间的各段的内容要发生变化时,才会将父进程的内容复制一份给子进程。
2. 测试RDB持久化
因为是临时文件,如果redis关闭之后,rdb的东西就
1.redis相关配置
# 快照
################################ SNAPSHOTTING ################################
#save 秒钟 写操作次数,例如:60秒传10000次的写操作
save 20 3#关闭写入磁盘操作。比如当Redis无法写入磁盘的话,直接关掉Redis的写操作
stop-writes-on-bgsave-error yes#对于存储到磁盘中的快照,可以设置是否进行压缩存储,如果你不想消耗CPU来进行压缩的话,可以设置为关闭此功能。
#推荐yes.
rdbcompression yes#增加数据校验,增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能
rdbchecksum yes#在redis.conf中配置文件名称,默认为dump.rdb
dbfilename dump.rdb#默认为Redis启动时命令行所在的目录下
dir ./
2. 测试步骤
#备份dump.rdb文件
cp dump.rdb d.rdb#关闭redis,并删除dump.rdb文件,用来模拟redis出现异常关闭
rm -rf dump.rdb#在启动之前,恢复dump.rdb文件
mv d.rdb dump.rdb#启动redis, 备份数据将会直接加载
> keys *
3. RDB的优缺点
1.优点
-
适合大规模的数据恢复
-
对数据完整性和一致性要求不高更适合使用
-
节省磁盘空间
-
恢复速度快
2. 缺点
-
Fork的时候,内存中的数据被克隆了一份,大致2倍的膨胀性需要考虑
-
虽然Redis在fork时使用了写时拷贝技术,但是如果数据庞大时还是比较消耗性能。
-
在备份周期在一定间隔时间做一次备份,所以如果Redis意外down掉的话,就会丢失最后一次快照后的所有修改。
2. AOF(Append Only File)
1. AOF的备份机制
以日志的形式来记录每个写操作(增量保存),将Redis执行过的所有写指令记录下来(读操作不记录), 只许追加文件但不可以改写文件。
redis启动之初会读取该文件重新构建数据,换言之,redis 重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。
2.测试AOF持久化
AOF的备份机制和性能虽然和RDB不同,但是备份和恢复的操作同RDB一样,都是拷贝备份文件,需要的时候再拷贝到Redis工作目录下,启动系统即加载。
开启AOF
默认是不开启AOF,开启RDB
在redis.conf配置文件中
-
若想开启AOF持久化策略,将 appendonly 修改为 yes
-
AOF文件的名称,默认为 appendonly.aof
-
AOF文件的保存路径,默认同RDB的路径一致
-
重启redis-server服务后,产生 appendonly.aof 文件
-
若AOF和RDB同时开启,则系统将默认优先读取AOF的数据,数据不存在丢失情况。
测试AOF
1. 退出容器
SHUTDOWN save
2. 重启容器
重启容器后,数据都在
3. 去除rdb文件和aof文件,再次重启容器
数据全部消失
3.若AOF文件损坏,恢复数据
1.修改AOF文件
通过vim来修改文件
2.再次启动容器
容器无法正常重新启动,容器日志中:
3. 将损坏文件备份,再次启动
4. 恢复文件
用备份文件将新生成的aof文件覆盖
# 修改损坏的aof文件
redis-check-aof --fix appendonly.aof
修改好配置文件后,需要重新启动容器,因为容器启动时读取的文件的空的aof文件,只有重新启动容器,再次能读取修改后的aof文件,才能获取到数据
4. AOF同步频率机制
AOF不能够单独使用,由于是每秒同步,所以最后一秒的数据很有可能丢失;
#始终同步,每次Redis的写入都会立刻记入日志;性能较差但数据完整性比较好
appendfsync always#每秒同步,每秒记入日志一次,如果宕机,本秒的数据可能丢失
appendfsync everysec#redis 不主动进行同步,把同步时机交给操作系统
appendfsync no
5. 重写压缩操作
AOF采用文件追加方式,文件会越来越大。为避免出现此情况,新增了重写机制,当AOF文件的大小超过所设定的阈值时,Redis就会启动AOF文件的内容压缩,只保留可以恢复数据的最小指令集。
机制
AOF文件持续增长而过大时,会fork出一条子进程来将文件重写
no-appendfsync-on-rewrite:
#缓存,yes ,不写入aof文件只写入缓存,用户请求不会阻塞,但是在这段时间如果宕机会丢失这段时间的缓存数据。(降低数据安全性,提高性能)
#磁盘,no,还是会把数据往磁盘里刷,但是遇到重写操作,可能会发生阻塞。(数据安全,但是性能降低)
重写时间点
- Redis会记录上次重写时的AOF大小,默认配置是当AOF文件大小是上次rewrite后大小的一倍且文件大于64M时触发,重写虽然可以节约大量磁盘空间,减少恢复时间。但是每次重写还是有一定的负担的,因此设定Redis要满足一定条件才会进行重写。
# 设置重写的基准值,文件达到100%时开始重写(文件是原来重写后文件的2倍时触发,即128M)
auto-aof-rewrite-percentage
#设置重写的基准值,最小文件64MB,达到这个值开始重写
auto-aof-rewrite-min-size
重写流程
- bgrewriteaof触发重写,判断是否当前有bgsave或bgrewriteaof在运行,如果有,则等待该命令结束后再继续执行。
- 主进程fork出子进程执行重写操作,保证主进程不会阻塞。
- 子进程遍历redis内存中数据到临时文件,客户端的写请求同时写入aof_buf缓冲区和aof_rewrite_buf重写缓冲区保证原AOF文件完整以及新AOF文件生成期间的新的数据修改动作不会丢失。
- 1)子进程写完新的AOF文件后,向主进程发信号,父进程更新统计信息。 2).主进程把aof_rewrite_buf中的数据写入到新的AOF文件。
- 使用新的AOF文件覆盖旧的AOF文件,完成AOF重写
6. AOF持久化流程
- 客户端的请求写命令会被append追加到AOF缓冲区内(日志文件);
- AOF缓存区工具AOF持久化策略将操作sync同步到磁盘的AOF文件中;
- AOF文件带下超过重写策略或手动重写时,会对AOF文件rewrite重写,压缩AOF文件容量;
- Redis服务重启时,会重新加载AOF文件中的写操作达到数据恢复的目的;
7.AOF优缺点
优点:
- 备份机制更稳健,丢失数据概率更低;
- 可读的日志文本,通过操作AOF文件,可以处理误操作;
缺点:
- 比起RDB占用更多的磁盘空间;
- 恢复备份速度要慢(因为是根据记录的写操作,将数据重新写入到redis中)
- 名称读写都同步的话,有一定的性能压力;
- 存在个别bug,造成不能恢复
3.RDB与AOF的区别
- 数据量和恢复速度:RDB 备份速度快,但是可能会丢失从上次备份到发生故障之间的数据;AOF 记录了所有的写操作,故障发生时可以通过重放命令来完全恢复,但是恢复速度可能较慢
- 文件类型:RDB 是二进制格式,AOF 是文本格式。
- 使用场景:RDB 更适合用于备份、导出数据、快速恢复等场景;AOF 更适合用于数据持久化和保证数据安全性(因为它记录了每个写操作)。