Redis-持久化

小笨猪-

于 2024-09-28 17:17:42 发布

阅读量418

点赞数 10

分类专栏： Redis 文章标签： java 开发语言 redis

本文链接：https://blog.csdn.net/qq_74812898/article/details/142587685

版权

Redis 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

首先,我们明白一个概念,

硬盘=>持久

内存=>不持久

而Redis是一个内存数据库,不持久,相比于Mysql这样的关系型数据库,最明显的特点是快/效率高

为了保证速度快,数据要保存再内存中,为了持久,存储在硬盘上

所以redis决定:

插入=>内存＋硬盘(硬盘是为了在redis重启时,恢复内存中的数据)

代价:消耗了更多空间,但是硬盘成本低,损耗小

持久化策略:

RDB=>定期备份

比方说每个月我把我电脑硬盘上的学习资料,整体的备份到备份盘中

AOF=>实时备份

比方说只要我下载了一个新的学习资料,立即把这个学习资料在备份盘中拷贝一份

1. RDB(Redis DataBase)

RDB持久化是把当前进程数据⽣成快照(RDB文件),保存到硬盘的过程

后续Redis一旦重启(内存数据没了),就可以根据刚才的"快照"把数据恢复

快照可以在重启后用以恢复数据

1.1 触发机制

1.1.1 手动触发

通过redis客户端,执行特定的命令,来触发快照生成

save

执行save命令时,快照生成,此时阻塞Redis的其它命令,直至RDB过程完成为止

对于内存⽐较⼤的实例造成⻓时间阻塞,类似于key *的结果，不建议使用

bgsave

不会影响Redis服务器的其它请求和命令

那是怎么做到呢?是偷摸搞了个多线程嘛?

并不是

此时redis使用"多进程"方式来完成并发编程

由于这里的数据比较少,执行bgsave瞬间就完成了

如果数据太多,执行bgsave就会消耗一定的时间,立即查看不一样就生成完毕.

通过上述的操作,就可以看到,redis服务器在重启的时候,加载了rdb文件的内容,恢复了内存之前的状态了.

1.1.2 自动触发

①在配置文件中使⽤save配置:

如"save m n"表⽰m秒内数据集发⽣了n次修改，⾃动RDB持久化

配置文件修改之后,一定要重新启动服务器,才能生效

此处的数值可以修改,但是有一个基本的原则:

生成一次RDB快照,这个成本是比较高的,不能让这个操作执行的太频繁

举个例子:

save 60 10000(两次生成rdb之间的间隔,最少是60s)

12:00:00 生成了rdb(硬盘上的快照数据和内存中一致)

12:00:01 开始,redis收到了大量的key的变化请求

12:01:00 生成下一个快照文件

如果在这之间,redis服务器挂了,此时就会导致12:00:00之后的这些数据都丢了

②从节点进⾏全量复制操作时，主节点⾃动进⾏RDB持久化，随后将RDB⽂件内容发送给从结点。

③执⾏shutdown命令关闭Redis时，执⾏RDB持久化(service redis-server restart) -正常关闭

刚才bgsave并没有执行,但是这个key2重启之后仍然存在

如果是通过正常流程重启redis服务器,此时redis服务器会在退出的时候,自动触发rdb操作

但如果是异常重启(kill -9或者其它),此时redis服务器就来不及生成rdb,内存中尚未保存在快照中的数据,就会随重启而丢失

1.2 流程说明

执⾏bgsave命令，Redis⽗进程判断当前进是否存在其他正在执⾏的⼦进程，如RDB/AOF⼦进程，如果存在bgsave命令直接返回。
⽗进程执⾏fork创建⼦进程，fork过程中⽗进程会阻塞。
⽗进程fork完成后，可以继续响应其他命令。
⼦进程创建RDB⽂件，根据⽗进程内存⽣成临时快照⽂件，完成后对原有⽂件进⾏替换。
进程发送信号给⽗进程表⽰完成，⽗进程更新统计信息。

bgsave操作流程是创建子进程,子进程完成持久化操作(持久化速度太快了[数据少],难以观察到子进程)

持久化会把数据写入新的文件中,然后使用新的文件替换旧的文件 (容易观察到)

可以使用stat命令,查看文件的inode编号:

1.3 RDB文件的处理

保存:

RDB⽂件保存在dir配置指定的⽬录（默认/var/lib/redis/）下

⽂件名通过dbfilename 配置（默认dump.rdb）指定

dump.rdb:

RDB机制生成的镜像文件,redis服务器默认是开启了RDB的

把内存中的数据,以压缩的形式(需要消耗一定的CPU资源,但能节省存储空间),保存在这个二进制文件中:

redis提供了RDB文件的检查工具:

RDB持久化操作,是可以触发多次的:

当执行生成RDB镜像时,此时就会把要生成的快照数据,先保存到一个临时文件中,当这个快照生成后,再删除之前的RDB文件,把新生成的临时的RDB文件名改成刚才的dump.rdb

自始至终,RDB文件始终只有一个

如果把RDB文件故意搞坏了,会怎么样?

手动的把rdb文件内容改坏,然后通过kill 进程的方式,重启服务器

如果通过service redis-server restart重启,就会在redis服务器退出的时候,重新生成rdb快照

如果改坏的地方是文件末尾,没有影响,如果是中间位置,会发现redis服务器可能无法启动

当redis服务器挂了之后,可以看看redis日志,了解一下发生了什么

也可能redis服务器能启动,但是得到的数据可能有问题:

通过检查工具,查看rdb文件格式是否符合要求,运行的时候,加入rdb文件作为命令行参数

此处就是以检查工具的方式来运行,不会真的启动redis服务器

1.4 优缺点

RDB是⼀个紧凑压缩的⼆进制⽂件，代表Redis在某个时间点上的数据快照。⾮常适⽤于备份，全量复制等场景。
Redis加载RDB恢复数据远远快于AOF的⽅式 (RDB这里使用二进制的方式来组织数据,直接把数据读取到内存中,按照字节的格式取出来放到结构体/对象中即可,而AOF是使用文本的方式来组织数据的,需要进行一系列的字符串切分操作)
RDB⽅式数据没办法做到实时持久化/秒级持久化,因为bgsave每次运⾏都要执⾏fork创建⼦进程，属于重量级操作，频繁执⾏成本过⾼。
RDB⽂件使⽤特定⼆进制格式保存,Redis版本演进过程中有多个RDB版本，兼容性可能有⻛险。
最大的问题,不能实时的持久化保存数据,在两次生成快照之间,实时的数据可能会随着重启而丢失

2. AOF(Append Only File)

以独⽴⽇志的⽅式记录每次写命令，重启时再重新执⾏AOF ⽂件中的命令达到恢复数据的⽬的

AOF的主要作⽤是解决了数据持久化的实时性，⽬前已经是Redis 持久化的主流⽅式

开启AOF时,RDB就不生效了

redis启动的时候,不再读取RDB文件的内容了,而是读取这个AOF文件中的内容,用来恢复数据

2.1 使用AOF

AOF默认是关闭状态,通过修改配置文件开启

AOF功能所在的位置,也是/var/lib/redis

通过一些特殊符号作为分隔符

2.2 AOF工作流程

所有的写⼊命令会追加到aof_buf（缓冲区）中。
AOF缓冲区根据对应的策略向硬盘做同步操作。
随着AOF⽂件越来越⼤，需要定期对AOF⽂件进⾏重写，达到压缩的⽬的。
当Redis服务器启动时，可以加载AOF⽂件进⾏数据恢复

Redis虽然是一个单线程的服务器,但是速度很快

为什么快?只操作内存

引入AOF之后,又要写内存,又要写硬盘,那还和之前一样快嘛?

实际上,是没有影响的

AOF机制并非直接让工作线程把数据写入硬盘,而是先写入一个内存中的缓冲区,积累一定后,再统一写入硬盘,大大降低了写硬盘的次数
硬盘上读写数据,顺序读写的速度是比较快的(比内存慢),随机访问则比较慢,AOF每次把新的操作写入原有文件的末尾,是顺序写入

如果把数据写入缓冲区,本质还是在内存中呀,万一这个时候,进程突然挂了,是不是缓冲区的数据就丢了?

是的!

要根据实际情况来取舍缓冲区的刷新频率

刷新频率越高,性能影响就越大,数据可靠性越高

刷新频率越低,性能影响就越小,数据可靠性越低

2.3 文件同步

可配置值	说明
always	命令写⼊aof_buf后调⽤fsync同步，完成后返回
everysec	命令写⼊aof_buf后只执⾏write操作，不进⾏ fsync。每秒由同步线程进⾏fsync
no	命令写⼊aof_buf后只执⾏write操作，由OS控制 fsync 频率

2.4 重写机制

2.4.1 引入

AOF文件持续增长,体积会越来越大,会影响到,redis下次启动的启动时间

redis启动时要读取AOF文件的内容

AOF文件虽然记录了中间的过程,但是Redis在重启时,只关注最终结果,AOF文件中的一些内容是冗余的

什么意思呢?

比如说:

因此,redis就存在一个机制(重写机制),能够针对AOF文件进行整理操作,剔除其中的冗余操作,并且合并一些操作,给AOF"瘦身"

2.4.2 触发机制

手动触发

调⽤bgrewriteaof命令

自动触发

根据auto-aof-rewrite-min-size和auto-aof-rewrite-percentage参数确定⾃动触发时机

auto-aof-rewrite-min-size：表⽰触发重写时AOF的最⼩⽂件⼤⼩，默认为64MB
auto-aof-rewrite-percentage：代表当前AOF占⽤⼤⼩相⽐较上次重写时增加的⽐例

2.4.3 重写流程

1.执⾏AOF重写请求。

如果当前进程正在执⾏AOF重写，请求不执⾏。
如果当前进程正在执⾏bgsave操作，重写命令延迟到bgsave完成之后再执⾏。

2. ⽗进程执⾏fork创建⼦进程(父进程负责接收请求,子进程负责重写)

3. 重写

主进程fork之后，继续响应其他命令。所有修改操作写⼊AOF缓冲区并根据appendfsync策略同步到硬盘，保证旧AOF⽂件机制正确。
⼦进程只有fork之前的所有内存信息，⽗进程中需要将fork之后这段时间的修改操作写⼊ AOF重写缓冲区中。

4. ⼦进程根据内存快照，将命令合并到新的AOF⽂件中。

注意:

重写的时候,不关心AOF文件中原来有什么,只关心内存最终的数据状态
子进程只需要把内存中当前的数据,获取出来,以AOF的格式写入到一个新的AOF文件中

5. ⼦进程完成重写

新⽂件写⼊后，⼦进程发送信号给⽗进程。
⽗进程把AOF重写缓冲区内临时保存的命令追加到新AOF⽂件中。
⽤新AOF⽂件替换⽼AOF⽂件

注意:

在创建子进程的一瞬间,子进程就继承了当前父进程的内存状态
因此,子进程里的内存数据是父进程fork之前的状态,fork之后新来的请求,对内存造成的修改,是子进程不知道的.
此时,父进程这里又准备了一个aof_rewrite_buf缓冲区,专门放fork之后收到的数据
子进程这边,把AOF数据写完之后,会通过信号通知一下i父进程,父进程再把aof_rewrite_buf缓冲区中的内容写入到新的AOF文件里
后面就可以用新的AOF文件代替旧的AOF文件了

问: