这篇文章我们聊聊 Redis 运维实战系列第 8 期–Redis 监控。
Redis 在很多互联网公司都充当着非常核心的角色,因此,监控 Redis 以保证其稳定显得格外重要。这节内容就来聊聊 Redis 的一些常见监控项。
1 连接检测
连接失败检测:当监控组件无法连接到 Redis 实例时,则触发告警。
客户端连接数:执行 info clients 命令获取 connected_clients 就是客户端连接数。
2 变量检测
maxmemory:执行 config get maxmemory 获取配置的最大内存,判断是否有设置或者是否合理。
maxmemory-policy:执行 config get maxmemory-policy 获取配置的最大内存策略。
3 主从复制检测
角色检测:执行 info replication 获取 role,如果 role 有变化则告警。
复制状态检测:在 slave 上执行 info replication 获取 master_link_status,判断主从是否断开,如果为 down,则触发告警。
延迟检测:主节点 info replication 的 master_repl_offset 和 slave0 字段的 offset 指标的差值,就是主从节点延迟的字节量,如下图: