1.redis多实例部署。
edis单线程架构导致无法充分利用CPU多核特性,通常的做法是在一台机器上部署
多个redis实例。当多个实例开启AOF重写后,彼此之间会产生对CPU和IO的竞争。
对于单机多redis部署,如果同一时刻运行多个子进程,对当前系统影响将非常
明显,因此需要采用一种措施,把子进程工作进行隔离。
redis 的 info persistence提供了监控子进程运行状况的度量指标。
rdb_bgsave_in_progress:bgsave子进程是否正常运行。
rdb_current_bgsave_time_sec:当前运行bgsave的时间,-1表示未运行。
aof_enabled:是否开启AOF功能
aof_rewrite_in_progress:AOF重写子进程是否正在运行。
aof_rewrite_scheduled:在bgsave结束后是否运行AOF重写。
aof_current_rewrite_time_sec:当前运行AOF重写时间,-1表示未运行。
aof_current_size:AOF文件当前字节数。
aof_base_size:AOF上次重写rewrite字节数。
2.通过外部程序轮训控制AOF重写操作。
流程;
(1)外部程序定时轮询监控机器上所有redis实例。
(2)对于开启AOF的实例,查看 (aof_current_size-aof_base_size)/aof_base_size
确认增长率。
(3)当增长率超过特定阈值(如100%),执行bgrewriteaof 命令手动触发当前实例的AOF重写。
(4)运行期间循环检查 aof_rewrite_in_progress和 aof_current_rewrite_time_sec
指标,直到AOF重写结束。
(5)确认实例AOF重写完成后,再检查其他实例并重复(2)~(4),保证机器内每个redis
实例AOF重写串行化执行。
3.总结
redis提供了两种持久化方式:RDB,AOF
RDB使用一次性生成内存快照的方式,产生的文件紧凑压缩比更高,因此读取RDB
恢复速度更快。由于每次生成RDB开销较大,无法做到实时持久化,一般用于数据
冷备和复制传输。
save命令会阻塞主线程不建议使用,bgsave命令通过fork操作创建子进程生成RDB
避免阻塞。
AOF通过追加写命令到文件实现持久化,通过appendfsync参数可以控制实时、秒级持久化。
因为需要不断追加写命令,所以AOF文件体积逐渐变大,需要定期执行重写操作来降低
文件体积。
AOF重写可以通过auto-aof-rewrite-min-size和 auto-aof-rewrite-percentage
参数控制自动触发,也可以使用 bgrewriteaof 命令手动触发。
192.168.1.7:6379> bgrewriteaof
Background append only file rewriting started
后台日志。
2672:M 21 Jun 15:37:38.701 * Background append only file rewriting started by pid 6979
2672:M 21 Jun 15:37:38.743 * AOF rewrite child asks to stop sending diffs.
6979:C 21 Jun 15:37:38.743 * Parent agreed to stop sending diffs. Finalizing AOF...
6979:C 21 Jun 15:37:38.743 * Concatenating 0.00 MB of AOF diff received from parent.
6979:C 21 Jun 15:37:38.743 * SYNC append only file rewrite performed
6979:C 21 Jun 15:37:38.743 * AOF rewrite: 6 MB of memory used by copy-on-write
2672:M 21 Jun 15:37:38.820 * Background AOF rewrite terminated with success
2672:M 21 Jun 15:37:38.820 * Residual parent diff successfully flushed to the rewritten AOF (0.00 MB)
2672:M 21 Jun 15:37:38.820 * Background AOF rewrite finished successfully
子进程执行期间使用copy-on-rewrite 机制与父进程共享内存,避免内存消耗翻倍。
AOF重写期间还需要维护重写缓冲区,保存新的写入命令避免数据丢失。
持久化阻塞主线程场景有:fork 阻塞和AOF追加阻塞,fork阻塞时间跟内存量和
系统有关,AOF追加阻塞说明硬盘资源紧张。
单机下部署多个实例,为了防止出现多个子进程重写操作,建议做隔离控制,避免CPU
和IO资源竞争。