Redis作为一个缓存数据库,如果我们不设置其持久化方式,那么数据是不会被保存下来的,因为其基于内存进行数据存储,一旦服务器宕机后,其数据便不可恢复。
一、RDB方式的持久化
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存里。
1.rdb方式下redis如何进行数据持久化的?
Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。
2)关于fork
在Linux程序中,fork()会产生一个和父进程完全相同的子进程,但子进程在此后多会exec系统调用,出于效率考虑,Linux中引入了“写时复制技术”,一般情况父进程和子进程会共用同一段物理内存,只有进程空间的各段的内容要发生变化时,才会将父进程的内容复制一份给子进程。
3)rdb方式下保存的文件
redis.conf中配置文件名称,默认为dump.rdb
rdb文件的保存路径,也可以修改。默认为Redis启动时命令行所在的目录下
4)rdb的保存策略
在配置文件中,save即保存策略,默认配置的意思为:在60秒内进行了10000次写操作、或300秒内进行了10次写操作、在900秒内进行一次的写操作时,即达到这三个阈值的时候,会进行持久化,将数据持久化到 dump.rdb文件中。
还有一种情况就是正常关闭redis服务器的时候,会进行rdb持久化操作。
5)手动保存快照
命令save:
关于rdb持久化的几个配置项
6)rdb的手动备份与恢复
备份
恢复
•关闭Redis
•先把备份的文件拷贝到工作目录下
•启动Redis, 备份数据会直接加载
7)rdb的优缺点
优点:•节省磁盘空间,恢复数据快。
缺点:虽然Redis在fork时使用了写时拷贝技术,但是如果数据庞大时还是比较消耗性能。
•在备份周期在一定间隔时间做一次备份,所以如果Redis意外down掉的话,就会丢失最后一次快照后的所有修改。
二、AOF持久化方式
1.以日志的形式来记录每个写操作,将Redis执行过的所有写指令记录下来(读操作不记录),只许追加文件但不可以改写文件,Redis启动之初会读取该文件重新构建数据,换言之,Redis重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。
日志形式是我们可以看得懂的,该文件记录了每次的写操作。
AOF默认不开启,需要手动在配置文件中配置
可以在redis.conf中配置文件名称,默认为 appendonly.aof
AOF文件的保存路径,同RDB的路径一致
2.当rdb和aof同时开启的时候,redis按aof方式工作
3.aof模式下数据备份
AOF的备份机制和性能虽然和RDB不同, 但是备份和恢复的操作同RDB一样,都是拷贝备份文件,需要恢复时再拷贝到Redis工作目录下,启动系统即加载,AOF和RDB同时开启,系统默认取AOF的数据
4.数据恢复
AOF文件的保存路径,同RDB的路径一致。
如遇到AOF文件损坏,可通过
redis-check-aof --fix appendonly.aof 进行恢复
5.AOF同步的频率
6.AOF的Rewrite重写机制
AOF采用文件追加方式,文件会越来越大为避免出现此种情况,新增了重写机制,当AOF文件的大小超过所设定的阈值时,Redis就会启动AOF文件的内容压缩,只保留可以恢复数据的最小指令集.可以使用命令bgrewriteaof。
即重新去redis数据库读取当前的所有数据记录在文件中,放弃之前aof文件中记录的数据日志。
如之前日志中 有 set a a, set a b 两条日志操作记录,那么Rewrite重写后,就会只保留set a b 这条现存在redis中的数据对应的操作。
注意:并没有读取旧的aof文件,而是将整个内存中的数据库内容用命令的方式重写了一个新的aof文件,这点和快照有点类似。
7.何时进行重写?
重写虽然可以节约大量磁盘空间,减少恢复时间。但是每次重写还是有一定的负担的,因此设定Redis要满足一定条件才会进行重写。
系统载入时或者上次重写完毕时,Redis会记录此时AOF大小,当aof的当前大小为初次载入记录的文件大小的 2倍(配置中的100是100%的意思)时,或者当aof文件大于64mb时,进行重写。
8.aof的优点和缺点
优点:备份机制更稳健,丢失数据概率更低。
可读的日志文本,通过操作AOF稳健,可以处理误操作
缺点:比起RDB占用更多的磁盘空间
恢复备份速度要慢
每次读写都同步的话,有一定的性能压力。
存在个别Bug,造成有时恢复失败
--官方推荐rdb和aof两种方式都启用,如果对数据不敏感,则使用rdb,不建议单独使用aof,因为可能出现bug。
但如果只把redis当作缓存数据库,不要求保留数据的话,这两种持久化方式可以都关闭。