redis应用06:持久化

参考

https://redis.io/topics/persistence

https://segmentfault.com/a/1190000002906345

http://redisdoc.com/topic/persistence.html

https://blog.csdn.net/Leon_cx/article/details/81545178

Redis Persistence

Redis提供了不同的持久性选项:

RDB持久性以指定的时间间隔执行数据集的时间点快照。

AOF持久性记录服务器接收的每个写操作,将在服务器启动时再次播放,重建原始数据集。 使用与Redis协议本身相同的格式以仅追加方式记录命令。 当Redis太大时,Redis能够重写日志背景。

如果您愿意,只要服务器正在运行,您就可以根据需要禁用持久性。

可以在同一实例中组合AOF和RDB。 请注意,在这种情况下,当Redis重新启动时,AOF文件将用于重建原始数据集,因为它保证是最完整的。

最重要的是要理解RDB和AOF持久性之间的不同权衡。 让我们从RDB开始:

RDB的优势

RDB是Redis数据的一个非常紧凑的单文件时间点表示。 RDB文件非常适合备份。 例如,您可能希望在最近24小时内每小时归档您的RDB文件,并且每天保存RDB快照30天。 这使您可以在发生灾难时轻松恢复不同版本的数据集。

RDB非常适合灾难恢复,可以将单个压缩文件传输到远端数据中心,也可以传输到Amazon S3(可能是加密的)。

RDB最大限度地提高了Redis的性能,因为Redis父进程为了坚持而需要做的唯一工作是分配一个将完成所有其余工作的孩子。 父实例永远不会执行磁盘I / O或类似操作。

与AOF相比,RDB允许使用大数据集更快地重启。

RDB的缺点

如果您需要在Redis停止工作时(例如断电后)将数据丢失的可能性降至最低,则RDB并不好。 您可以配置生成RDB的不同保存点(例如,在对数据集进行至少五分钟和100次写入之后,您可以拥有多个保存点)。 但是,您通常每五分钟或更长时间创建一个RDB快照,因此如果Redis因任何原因停止工作而没有正确关闭,您应该准备丢失最新的数据分钟。

RDB经常需要fork()才能使用子进程持久存储在磁盘上。 如果数据集很大,Fork()可能会很耗时,如果数据集非常大且CPU性能不佳,可能会导致Redis停止服务客户端几毫秒甚至一秒钟。 AOF也需要fork(),但你可以调整你想要重写日志的频率,而不需要对耐久性进行任何权衡。

AOF优势

使用AOF Redis更持久:您可以使用不同的fsync策略:根本没有fsync,每秒fsync,每次查询都有fsync。使用fsync的默认策略,每秒写入性能仍然很好(fsync使用后台线程执行,主线程将在没有fsync正在进行时努力执行写入。)但是您只能丢失一秒的写入。

AOF日志是仅附加日志,因此如果停电,则没有搜索,也没有损坏问题。即使日志由于某种原因(磁盘已满或其他原因)以半写命令结束,redis-check-aof工具也能够轻松修复它。

当Redis太大时,Redis能够在后台自动重写AOF。重写是完全安全的,因为当Redis继续附加到旧文件时,使用创建当前数据集所需的最小操作集生成一个全新的文件,并且一旦第二个文件准备就绪,Redis将切换两个并开始附加到新的那一个。

AOF以易于理解和解析的格式一个接一个地包含所有操作的日志。您甚至可以轻松导出AOF文件。例如,即使您使用FLUSHALL命令刷新了所有错误,如果在此期间未执行日志重写,您仍然可以保存数据集,只需停止服务器,删除最新命令,然后重新启动Redis。

AOF的缺点

AOF文件通常比同一数据集的等效RDB文件大。
根据确切的fsync策略,AOF可能比RDB慢。通常将fsync设置为每秒性能仍然非常高,并且在禁用fsync的情况下,即使在高负载下,它也应该与RDB一样快。即使在大量写入负载的情况下,RDB仍能够提供有关最大延迟的更多保证。
在过去,我们遇到了特定命令中的罕见错误(例如,有一个涉及阻塞命令,如BRPOPLPUSH)导致生成的AOF在重新加载时不会重现完全相同的数据集。这个错误很少见,我们在测试套件中进行测试,自动创建随机复杂数据集并重新加载它们以检查一切是否正常,但RDB持久性几乎不可能出现这种错误。为了更清楚地说明这一点:Redis AOF逐步更新现有状态,如MySQL或MongoDB,而RDB快照一次又一次地创建所有内容,这在概念上更加健壮。但是
1)应该注意的是,每次通过Redis重写AOF时,都会从数据集中包含的实际数据开始从头开始重新创建,与始终附加的AOF文件(或一个重写的读取文件)相比,可以更好地抵抗错误旧的AOF而不是读取内存中的数据)。
2)我们从未向用户提供过关于在现实世界中检测到的AOF损坏的单一报告。

好的,我该怎么用?

一般的迹象是,如果您希望一定程度的数据安全性与PostgreSQL可为您提供的数据安全性相当,则应使用两种持久性方法。

如果你非常关心你的数据,但是在发生灾难的情况下仍然会有几分钟的数据丢失,你可以单独使用RDB。

有许多用户单独使用AOF,但我们不鼓励它,因为不时有RDB快照是进行数据库备份,更快重启以及AOF引擎中出现错误的好主意。

注意:由于所有这些原因,我们可能最终将AOF和RDB统一到未来的单一持久性模型中(长期计划)。

以下部分将说明有关两种持久性模型的更多详细信息。

快照

默认情况下,Redis将数据集的快照保存在磁盘上,名为dump.rdb的二进制文件中。 如果数据集中至少有M个更改,则可以将Redis配置为每N秒保存数据集,或者您可以手动调用SAVE或BGSAVE命令。

For example, this configuration will make Redis automatically dump the dataset to disk every 60 seconds if at least 1000 keys changed:

save 60 1000
This strategy is known as snapshotting.

How it works
Whenever Redis needs to dump the dataset to disk, this is what happens:

Redis forks. We now have a child and a parent process.

The child starts to write the dataset to a temporary RDB file.

When the child is done writing the new RDB file, it replaces the old one.

当孩子完成编写新的RDB文件后,它将替换旧的文件。

Append-only file

快照不是很耐用。 如果运行Redis的计算机停止运行,电源线发生故障,或者您意外杀死了实例,则Redis上写入的最新数据将丢失。 虽然这对某些应用程序来说可能不是什么大问题,但是有完整持久性的用例,在这些情况下,Redis不是一个可行的选择。

The append-only file is an alternative, fully-durable strategy for Redis. It became available in version 1.1.

You can turn on the AOF in your configuration file:

appendonly yes
From now on, every time Redis receives a command that changes the dataset (e.g. SET) it will append it to the AOF. When you restart Redis it will re-play the AOF to rebuild the state.

您可以在配置文件中打开AOF:
appendonly yes
从现在开始,每次Redis收到更改数据集的命令(例如SET)时,它都会将其附加到AOF。 当您重新启动Redis时,它将重新播放AOF以重建状态。

Log rewriting

你可以猜到,随着写操作的执行,AOF变得越来越大。例如,如果您将计数器递增100次,则最终会在数据集中包含一个包含最终值的单个键,但您的AOF中会有100个条目。重建当前状态不需要其中99个条目。

所以Redis支持一个有趣的功能:它能够在后台重建AOF而不会中断对客户端的服务。每当您发出BGREWRITEAOF时,Redis都会编写在内存中重建当前数据集所需的最短命令序列。如果您在Redis 2.2中使用AOF,则需要不时运行BGREWRITEAOF。 Redis 2.4能够自动触发日志重写(有关详细信息,请参阅2.4示例配置文件)。

仅附加文件的持久性如何?
您可以配置Redis将在磁盘上同步数据的次数。有三种选择:

每次将新命令附加到AOF时都会执行fsync。非常慢,非常安全。

每秒fsync。足够快(2.4可能与快照一样快),如果发生灾难,您可能会丢失1秒的数据。

永远不要fsync,只需将数据放在操作系统的手中。更快,更安全的方法。

建议(和默认)策略是每秒fsync。它非常快速且非常安全。总是在实践中策略很慢(尽管在Redis 2.0中有所改进) - 没有办法使fsync比它更快。

如果我的AOF被破坏了该怎么办?

服务器在写入AOF文件时可能崩溃(这仍然不应导致不一致),以不再可由Redis加载的方式破坏文件。 发生这种情况时,您可以使用以下过程解决此问题:

制作AOF文件的备份副本。

使用Redis附带的redis-check-aof工具修复原始文件:

$ redis-check-aof --fix

(可选)使用diff -u来检查两个文件之间的区别。

使用固定文件重新启动服务器。

这个怎么运作

日志重写使用已用于快照的相同的写时复制技巧。 这是它的工作原理:

Redis分叉,所以现在我们有了一个子进程和一个父进程。

孩子开始在临时文件中写入新的AOF。

父级在内存缓冲区中累积所有新的更改(但同时它将新的更改写入旧的仅附加文件中,因此如果重写失败,我们是安全的)。

当子项完成重写文件时,父项获取一个信号,并在子项生成的文件末尾附加内存缓冲区。

现在,Redis以原子方式将旧文件重命名为新文件,并开始将新数据附加到新文件中。

如果我当前正在使用dump.rdb快照,我如何切换到AOF?

在Redis 2.0和Redis 2.2中有一个不同的程序可以做到这一点,因为你可以猜测它在Redis 2.2中更简单,并且根本不需要重启。

Redis> = 2.2

备份最新的dump.rdb文件。
将此备份转移到安全的地方。
发出以下两个命令:
redis-cli config set appendonly yes
redis-cli config set save“”
确保您的数据库包含相同数量的密钥。
确保写入正确附加到仅附加文件。
第一个CONFIG命令启用仅附加文件。为了做到这一点,Redis将阻止生成初始转储,然后将打开文件进行写入,并将开始附加所有下一个写入查询。

第二个CONFIG命令用于关闭快照持久性。如果您希望可以同时启用持久性方法,则这是可选的。

重要提示:请记住编辑redis.conf以打开AOF,否则当您重新启动服务器时,配置更改将丢失,服务器将使用旧配置重新启动。

Redis 2.0

备份最新的dump.rdb文件。
将此备份转移到安全的地方。
停止对数据库的所有写入!
发布redis-cli bgrewriteaof。这将创建仅附加文件。
Redis完成生成AOF转储后停止服务器。
编辑redis.conf end enable仅附加文件持久性。
重启服务器。
确保您的数据库包含相同数量的密钥。
确保写入正确附加到仅附加文件。

AOF和RDB持久性之间的相互作用

Redis> = 2.4确保在RDB快照操作正在进行时避免触发AOF重写,或者在AOF重写正在进行时允许BGSAVE。 这可以防止两个Redis后台进程同时执行大量磁盘I / O.

当快照正在进行并且用户使用BGREWRITEAOF明确请求日志重写操作时,服务器将回复一个OK状态代码,告诉用户操作已安排,并且一旦快照完成,重写将开始。

在启用AOF和RDB持久性并且Redis重新启动的情况下,AOF文件将用于重建原始数据集,因为它保证是最完整的。

备份Redis数据

在开始本节之前,请务必阅读以下句子:确保备份数据库。磁盘中断,云中的实例消失,等等:没有备份意味着数据消失到/ dev / null的巨大风险。

Redis非常适合数据备份,因为您可以在数据库运行时复制RDB文件:RDB一旦生成就永远不会被修改,并且在生成时它使用临时名称并仅使用rename(2)以原子方式重命名为其最终目标新快照完成时。

这意味着在服务器运行时复制RDB文件是完全安全的。这就是我们的建议:

在服务器中创建一个cron作业,在一个目录中创建RDB文件的每小时快照,在另一个目录中创建每日快照。
每次运行cron脚本时,请确保调用find命令以确保删除过旧的快照:例如,您可以获取最近48小时的每小时快照,以及一到两个月的每日快照。确保使用数据和时间信息命名快照。
每天至少有一次确保在数据中心外部或至少在运行Redis实例的物理机器外部传输RDB快照。

灾难恢复

Redis环境中的灾难恢复基本上与备份相同,并且能够在许多不同的外部数据中心中传输这些备份。这样,即使在某些灾难性事件影响Redis正在运行并生成其快照的主数据中心的情况下,数据也是安全的。

由于许多Redis用户都处于启动阶段,因此没有足够的资金支出,我们将审查最有趣的灾难恢复技术,而这些技术的成本并不高。

Amazon S3和其他类似服务是安装灾难恢复系统的好方法。只需以加密形式将每日或每小时RDB快照传输到S3即可。您可以使用gpg -c加密数据(在对称加密模式下)。确保将密码存储在许多不同的安全位置(例如,将副本提供给组织中最重要的人员)。建议使用多种存储服务以提高数据安全性。
使用SCP(SSH的一部分)将快照传输到远程服务器。这是一个相当简单和安全的途径:在离你很远的地方获得一个小的VPS,在那里安装ssh,并生成一个没有密码短语的ssh客户端密钥,然后将它添加到你的小VPS的authorized_keys文件中。您已准备好以自动方式传输备份。在两个不同的提供商中获得至少两个VPS以获得最佳结果。
重要的是要理解,如果没有以正确的方式编码,该系统很容易失败。至少要确保在传输完成后,您可以验证文件大小(应该与您复制的文件相匹配)以及可能的SHA1摘要(如果您使用的是VPS)。

如果由于某种原因传输新备份不起作用,您还需要某种独立的警报系统。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值