Redis教程:数据持久化

目录

1 RDB持久化

1.1 RDB文件的创建和载入

1.2 自动间隔性保存

1.3 RDB文件结构

2 AOF持久化

2.1 AOF持久化的实现

2.2 AOF文件的载入与数据还原

2.3 AOF重写机制

2.4 混合持久化



1 RDB持久化

       Redis提供了RDB持久化功能,可以将Redis内存中的数据库状态保存到磁盘中,避免数据意外丢失。

1.1 RDB文件的创建和载入

       有两个Redis命令可以用于生成RDB文件,一个是SAVE,另一个是BGSAVE

  • SAVE命令会阻塞Redis服务器,直到RDB文件创建完毕为止,在服务器进程阻塞期间,服务器不能处理任何命令请求。
  • BGSAVE命令会派生出一个子进程,然后由子进程负责创建RDB文件,服务器进程(父进程)继续处理命令请求。

另外值得一提的是,因为AOF文件的更新频率通常比RDB文件的更新频率高,所以:

  • 如果服务器开启了AOF持久化功能,那么服务器就会优先使用AOF文件来还原数据库状态
  • 只有在AOF持久化功能处于关闭状态时,服务器才会使用RDB文件来还原数据库状态

RDB文件载入时的服务器状态:服务器在载入RDB文件期间,会一直处于阻塞状态,直到载入工作完成为止。

1.2 自动间隔性保存

       BGSAVE命令可以在不阻塞服务器的情况下执行,所以Redis允许用户通过设置服务器配置的save选项,让服务器每隔一段时间自动执行一次BGSAVE命令。用户可以通过save选项设置多个保存条件,但只要其中一个条件被满足,服务器就会执行BGSAVE命令。举个栗子,如果我们向服务器提供以下配置:

save    900     1        //900秒内对数据库进行了至少一次的修改 
save    300     10       //300秒内对数据库进行了至少十次的修改
save    60      10000    //60秒内对数据库进行了至少一万次的修改

服务器会根据save选项所设置的保存条件,设置服务器状态redisServer结构体的saveparams属性:

redis.h

struct redisServer {
    ……
    //记录了保存条件的数组
    struct saveparam *saveparams;  
    ……
};

struct saveparam {
    //秒数
    time_t seconds;
    //修改数
    int changes;
};

服务器状态中的saveparams数组将会是图1-1所示:

图1-1   服务器状态中的保存条件

dirty计数器和lastsave属性

除了saveparams数组之外,服务器状态还维持着一个dirty计数器,以及一个lastsave属性:

  • dirty计数器记录距离上一次成功执行SAVE命令或者BGSAVE命令之后,服务器对数据库状态(服务器中的所有数据库)进行了多少次修改(包括写入、删除、更新等操作)
  • lastsave属性是一个Unix时间戳,记录了服务器上一次成功执行SAVE命令或BGSAVE命令的时间

redis.h

struct redisServer {
    ……
    //修改计数器
    long long dirty;              
    ……
    //上一次执行保存的时间
    time_t lastsave;              
    ……
};

检查保存条件是否满足

        Redis的服务器周期性操作函数serverCron默认每隔100毫秒就会执行一次,该函数用于对正在运行的服务进行维护,它的其中一项工作就是检查save选项所设置的保存条件是否满足,如果满足,就执行BGSAVE命令.

      以下伪代码展示了serverCron函数检查保存条件的过程:

def serverCron():   
    # …   
    # 遍历所有保存条件   
    for saveparam in server.saveparams:      
         # 计算距离上次执行保存操作有多少秒      
         save_interval = unixtime_now()-server.lastsave   
     
        # 如果数据库状态的修改次数超过条件所设置的次数      
        # 并且距离上次保存的时间超过条件所设置的时间       
        # 那么执行保存操作      
         if      server.dirty >= saveparam.changes and \
                   save_interval > saveparam.seconds:      
      
                BGSAVE();
     # ...

1.3 RDB文件结构

图1-2   RDB文件结构

Redis部分的长度为5字节,保存着"REDIS"五个字符。 db_version长度为4字节,它的值是一个字符串表示的整数,这个整数记录了RDB文件的版本号,比如"0006"就代表RDB文件的版本为第六版。

databases部分包含着零个至任意多个数据库以及各个数据库中的键值对数据:

  • 如果服务器的数据库状态为空(所有数据库都是空的),那么这个部分也为空,长度为0字节
  • 如果服务器的数据库状态为非空(有至少一个数据库非空),那么这个部分也为非空,根据数据库所保存键值对的数量、类型和内容的不同,这个部分的长度也会有所不同

EOF常量的长度为1字节,这个常量标志着RDB文件正文内容结束。check_num是一个8字节长的无符号整数,保存着一个校验和,这个校验和是程序通过对REDIS、db_version、databases、EOF四部分的内容进行计算得出的。

2 AOF持久化

       除了RDB持久化功能之外,Redis还提供了AOF(Append Only File)持久化功能,与RDB持久化通过保存数据库中的键值对来记录数据库状态不同,AOF持久化是通过保存Redis服务器所执行的命令来记录数据库状态。

2.1 AOF持久化的实现

AOF持久化功能的实现可以分为命令追加(append)、文件写入、文件同步(sync)三个步骤:

命令追加

        当AOF持久化功能处于打开状态时,服务器在执行完一个写命令后,会以协议格式将被执行的写命令追加到服务器状态的aof_buf缓冲区的末尾。

redis.h

struct redisServer {
    ……
    //AOF缓冲区
    sds aof_buf;     
    ……
};

服务器在执行这个SET命令之后,会将协议内容追加到aof_buf缓冲区的末尾:

AOF文件的写入与同步

       Redis的服务器进程就是一个事件循环,这个循环中的文件事件负责接收客户端的命令请求,以及向客户端发送命令回复,而时间事件则负责执行像serverCron函数这样需要定时运行的函数。因为服务器在处理文件事件时可能会执行写命令,使得一些内容被追加到aof_buf缓冲区里面,所以在服务器每次结束一个事件循环之前,它都会调用flushAppendOnlyFile函数,考虑是否需要将aof_buf缓冲区中的内容写入和保存到AOF文件里面

       flushAppendOnlyFile函数的行为由服务器配置的appendsync选项的值来决定,各个不同值产生的行为如表2-1所示:

表2-1   flushAppendOnlyFile函数的行为
appendfsync选项的值flushAppendOnlyFile函数的行为
always将aof_buf缓冲区中的所有内容写入并同步到AOF文件
everysec将aof_buf缓冲区中的所有内容写入到AOF文件,如果上次同步AOF文件的时间距离现在超过一秒钟,那么再次对AOF文件进行同步,并且这个同步操作是由一个线程专门负责执行的
no将aof_buf缓冲区中的所有内容写入到AOF文件,但并不对AOF文件进行同步,何时同步由操作系统来决定

      如果用户没有主动为appendsync选项设置值,那么appendsync选项的默认值为everysec。

2.2 AOF文件的载入与数据还原

        因为AOF文件里面包含了重建数据库状态所需的所有写命令,所以服务器只要读入并重新执行一遍AOF文件里面保存的写命令,就可以还原服务器关闭之前的数据库状态。Redis读取AOF文件并还原数据库状态的详细步骤如下:

  1. 创建一个不带网络连接的伪客户端(fake client):因为Redis的命令只能在客户端上下文执行,而载入AOF文件时所使用的命令直接来源于AOF文件而不是网络连接,所以服务器使用了一个没有网络连接的伪客户端来执行AOF文件保存的写命令,伪客户端执行命令的效果和网络连接的客户端执行命令的效果一样
  2. 从AOF文件中分析并读取出一条写命令
  3. 使用伪客户端执行被读取的写命令
  4. 一直执行步骤2和3,直到AOF文件中的所有写命令都被处理完毕为止

2.3 AOF重写机制

      为了解决AOF文件体积膨胀的问题,Redis提供了AOF文件重写功能。通过该功能,Redis服务器恶意创建一个新的AOF文件来替代现有的AOF文件,新旧两个AOF文件所保存的数据库状态相同,但新AOF文件不会包含任何浪费空间的冗余命令,所以新AOF文件的体积通常会比旧AOF文件的体积要小的多。

     Redis将AOF重写程序放到子进程里执行,这样做可以同时达到两个目的:

  • 子进程进行AOF重写期间,服务器进程(父进程)可以继续处理命令请求
  • 子进程带有服务器进程的数据副本,使用子进程而不是线程,可以在避免使用锁的情况下,保证数据的安全性

       不过,使用子进程也有一个问题需要解决,因为子进程在进行AOF重写期间,服务器进程还需要处理命令请求,而新的命令可能会对现有的数据库状态进行修改,从而使得服务器当前的数据库状态和重写后的AOF文件所保存的数据库状态不一致。

       为了解决这种数据不一致问题,Redis服务器设置了一个AOF重写缓冲区,这个缓冲区在服务器创建子进程之后开始使用,当Redis服务器执行完一个写命令之后,它会同时将这个写命令发送给AOF缓冲区和AOF重写缓冲区,如图2-1所示:

图2-1   服务器同时将命令发送给AOF文件和AOF重写缓冲区

也就是说,在子进程执行AOF重写期间,服务器进程需要执行以下三个工作:

  1. 执行客户端发来的命令
  2. 将执行后的写命令追加到AOF缓冲区
  3. 将执行后的写命令追加到AOF重写缓冲区

这样一来可以保证:

  • AOF缓冲区的内容会定期被写入和同步到AOF文件,对现有AOF文件的处理工作会如常进行
  • 从创建子进程开始,服务器执行的所有写命令都会被记录到AOF重写缓冲区里面

       当子进程完成AOF重写工作之后,它会向父进程发送一个信号,父进程在接到该信号之后,就会调用一个信号处理函数,并执行以下工作:

  1. 将AOF重写缓冲区中所有内容写入到新AOF文件中,这时新AOF文件所保存的数据库状态将和服务器当前的数据库状态一致
  2. 对新AOF文件进行改名,原子地覆盖现有的AOF文件,完成新旧两个AOF文件的替换

2.4 混合持久化

        混合持久化指进行AOF 重写时子进程将当前时间点的数据快照保 存为RDB 文件格式,而后将父进程累积命令保存为 AOF 格式。
        加载时,首先会识别AOF 文件是否以 REDIS 字符串开头,如果 是,就按RDB 格式加载,加载完 RDB 后继续按 AOF 格式加载剩余部分。
        是否开启混合持久化由如下配置设置:
aof-use-rdb-preamble yes

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值