10.redis哨兵详解

最新推荐文章于 2024-03-11 22:38:27 发布

qq_28613081

最新推荐文章于 2024-03-11 22:38:27 发布

阅读量107

点赞数

分类专栏： redis

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28613081/article/details/106367354

版权

redis 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

Sentinel命令

1. SENTINEL masters 显示被监控的所有master以及它们的状态.

2. SENTINEL master <master name> 显示指定master的信息和状态；

3. SENTINEL slaves <master name> 显示指定master的所有slave以及它们的状态；

4. SENTINEL get-master-addr-by-name <master name> 返回指定master的ip和端口，

如果正在进行failover或者failover已经完成，将会显示被提升为master的slave的ip和端口。

5. SENTINEL failover <master name> 强制sentinel执行failover，并且不需要得到其他sentinel的同意。

但是failover后会将最新的配置发送给其他sentinel。

Sentinel 实现原理

1.检测问题，主要讲的是三个定时任务，这三个内部的执行任务可以保证出现问题马上让 Sentinel 知道。

2.发现问题，主要讲的是主观下线和客观下线。当有一台 Sentinel 机器发现问题时，它就会主观对它主观下线。

但是当多个 Sentinel 都发现有问题的时候，才会出现客观下线。

3.找到解决问题的人，主要讲的是领导者选举，如何在 Sentinel 内部多台节点做领导者选举，选出一个领导者。

4.解决问题，主要讲的是故障转移，即如何进行故障转移。

三个定时任务

首先要讲的是内部 S`entinel 会执行以下三个定时任务。

每10秒每个 Sentinel 对 Master 和 Slave 执行一次 Info Replication 。

每2秒每个 Sentinel 通过 Master 节点的 channel 交换信息（pub/sub）。

每1秒每个 Sentinel 对其他 Sentinel 和 Redis 执行 ping 。

第一个定时任务，指的是 Redis Sentinel 可以对 Redis 节点做失败判断和故障转移，在 Redis 内部有三个定时任务作为基础，来 Info Replication 发现

Slave 节点，这个命令可以确定主从关系。

第两个定时任务，类似于发布订阅， Sentinel 会对主从关系进行判定，通过 _sentinel_:hello 频道交互。了解主从关系可以帮助更好的自动化操作 Redis

。然后 Sentinel 会告知系统消息给其它 Sentinel 节点，最终达到共识，同时 Sentinel 节点能够互相感知到对方。

第三个定时任务，指的是对每个节点和其它 Sentinel 进行心跳检测，它是失败判定的依据。

主观下线和客观下线

主观下线

每个 Sentinel 节点对 Redis 节点失败的“偏见”。之所以是偏见，只是因为某一台机器30秒内没有得到回复

客观下线

这个时候需要所有 Sentinel 节点都发现它30秒内无回复，才会达到共识

领导者选举方式

每个做主观下线的sentinel节点，会向其他的sentinel节点发送命令，要求将它设置成为领导者

收到命令sentinel节点，如果没有同意通过其它节点发送的命令，那么就会同意请求，否则就会拒绝

如果sentinel节点发现自己票数超过半数，同时也超过了 sentinel monitor mymaster 127.0.0.1 6379 2 超过2个的时候，就会成为领导者进行故障转移操作

如何选择“合适的”Slave 节点

Redis 内部其实是有一个优先级配置的，在配置文件中 slave-priority ，这个参数是 Salve 节点的优先级配置，如果存在则返回，如果不存在则继续。

当上面这个优先级不满足的时候， Redis 还会选择复制偏移量最大的 Slave节点，如果存在则返回，如果不存在则继续。之所以选择偏移量最大，这是因为偏移

量越小，和 Master 的数据越不接近，现在 Master 挂掉了，说明这个偏移量小的机器数据也可能存在问题，这就是为什么要选偏移量最大的 Slave 的原因。

如果发现偏移量都一样，这个时候 Redis 会默认选择 runid 最小的节点。

生产环境中部署技巧

1）Sentinel 节点不应该部署在一台物理“机器”上。

这里特意强调物理机是因为一台物理机做成了若干虚拟机或者现今比较流行的容器，它们虽然有不同的 ** IP ** 地址，但实际上它们都是同一台物理机，同

一台物理机意味着如果这台机器有什么硬件故障，所有的虚拟机都会受到影响，为了实现 Sentinel 节点集合真正的高可用，请勿将 ** Sentinel **节点部署在

同一台物理机器上。

2）部署至少三个且奇数个的 Sentinel 节点。

3) 个以上是通过增加 Sentinel 节点的个数提高对于故障判定的准确性，因为领导者选举需要至少一半加1个节点。

奇数个节点可以在满足该条件的基础上节省一个节点。

哨兵常见问题

哨兵集群在发现 master node 挂掉后会进行故障转移，也就是启动其中一个 slave node 为 master node 。在这过程中，可能会导致数据丢失的情况。

1、异步复制导致数据丢失

因为master->slave的复制是异步，所以可能有部分还没来得及复制到slave就宕机了，此时这些部分数据就丢失了。

2、集群脑裂导致数据丢失

脑裂，也就是说，某个master所在机器突然脱离了正常的网络，跟其它slave机器不能连接，但是实际上master还运行着。

造成的问题

此时哨兵可能就会认为master宕机了，然后开始选举，将其它 slave 切换成 master 。这时候集群里就会有2个 master ，也就是所谓的脑裂。

此时虽然某个 slave 被切换成了 master ，但是可能client还没来得及切换成新的 master ，还继续写向旧的 master 的数据可能就丢失了。

因此旧master再次恢复的时候，会被作为一个 slave 挂到新的 master 上去，自己的数据会被清空，重新从新的 master 复制数据。

怎么解决？

min-slaves-to-write 1

min-slaves-max-lag 10

要求至少有1个slave，数据复制和同步的延迟不能超过10秒

如果说一旦所有的slave，数据复制和同步的延迟都超过了10秒钟，那么这个时候，master就不会再接收任何请求了

上面两个配置可以减少异步复制和脑裂导致的数据丢失

1、异步复制导致的数据丢失

在异步复制的过程当中，通过 min-slaves-max-lag 这个配置，就可以确保的说，一旦 slave 复制数据和 ack 延迟时间太长，就认为可能 master 宕机

后损失的数据太多了，那么就拒绝写请求，这样就可以把master宕机时由于部分数据未同步到 slave 导致的数据丢失降低到可控范围内

2、集群脑裂导致的数据丢失

集群脑裂因为 client 还没来得及切换成新的 master ，还继续写向旧的 master 的数据可能就丢失了通过 min-slaves-to-write 确保必须是有多少个从

节点连接，并且延迟时间小于 min-slaves-max-lag 多少秒。

当然对于客户端需要怎么做呢？

对于 client 来讲，就需要做些处理，比如先将数据缓存到内存当中，然后过一段时间处理，或者连接失败，接收到错误切换新的 master 处理。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
10.redis哨兵详解

Sentinel 实现原理 1.检测问题，主要讲的是三个定时任务，这三个内部的执行任务可以保证出现问题马上让 Sentinel 知道。 2.发现问题，主要讲的是主观下线和客观下线。当有一台 Sentinel 机器发现问题时，它就会主观对它主观下线。但是当多个 Sentinel 都发现有问题的时候，才会出现客观下线。 3.找到解决问题的人，主要讲的是领导者选举，如何在 Sentinel 内部多台节点做领导者选举，选出一个领导者。 4.解决问题，主要讲的是故障转移，即如何进行故障转移。
复制链接

扫一扫

专栏目录

博客等级

码龄9年

87
原创

5
点赞

16
收藏

7
粉丝

关注

私信

热门文章

分类专栏

算法基础 2篇
mysql基础 2篇
srm 2篇
php 15篇
其他 1篇
lms-微信商城网站实战 8篇
redis 11篇
mysql 21篇
git 1篇
swoole 11篇
nginx 4篇
golang 2篇
redis基础 1篇
linux 3篇
docker 3篇
rabbitmq 1篇
网络通讯 1篇

最新评论

magento学习—2.docker搭建magento
sinat_41592662: 看这里 window docker 安装magento2.4.3本地开发环境，2022最新版， http://php-azure-yu.azurewebsites.net/docs/magento/magento-base/
mysql索引常见问题整理
ctotalk: 加油，不错。
6.网络io模型及阻塞模型
ctotalk: good.
docker-1.安装与基本使用
ctotalk: 谢谢分享，不错
9.redis哨兵机制
qq_28613081: 可以在docker上源码安装，可以拉一个redis镜像我的文件没有上传

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。