![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
orchestrator
文章平均质量分 72
orchestrator相关技术分享。
翔云123456
这个作者很懒,什么都没留下…
展开
-
orchestrator 中的 agent
Orchestrator是一个开源的MySQL高可用(High Availability)解决方案,它可以自动化执行MySQL故障转移、主从切换、数据中心迁移等操作,同时提供了一个Web界面和API接口,方便运维人员进行MySQL集群管理和监控。在Orchestrator 常用功能中,很少提及agent,实际上,Orchestrator 也有agent相关功能,并有一个独立的项目。在Orchestrator 中,通过配置项配置agent 相关功能是否开启,主要是http server。原创 2023-06-23 17:10:29 · 566 阅读 · 0 评论 -
MySQL HA(High Availability) 数据库高可用工具Orchestrator安装
本文主要介绍如何在本地安装 MySQL HA(High Availability) 数据库高可用工具Orchestrator。原创 2023-01-24 19:39:34 · 1529 阅读 · 0 评论 -
MySQL HA(High Availability) 数据库高可用工具Orchestrator 基本原理
`Orchestrator` 是一款开源的MySQL数据库高可用HA工具。它稳定可靠,通过分布式的集群部署模式,自身具备容灾能力。它功能强大,通过周期执行探测SQL,抓取MySQL 实例的基本信息,包括配置信息、复制状态等,可以得到MySQL的拓扑结构topology。并且,可以根据拓扑结构诊断故障analysis failure。本文主要介绍了基本工作原理,相信看完之后,一定会有所收获。原创 2022-12-18 21:28:07 · 991 阅读 · 0 评论 -
Orchestrator global recovery disable 全局开关
Orchestrator中,在MySQL集群粒度,有故障自动恢复开关,在全局粒度,也有一个全局的开关(global recovery disable)。本文主要介绍全局开关(global recovery disable)的基本实现方式。下面分别从几个层面阐述。原创 2022-10-23 13:11:38 · 427 阅读 · 0 评论 -
Orchestrator中的hooks函数
Orchestrator中有很多hooks函数,用于调用外部服务做一些配置或者准备等工作。原创 2022-09-30 23:10:21 · 639 阅读 · 0 评论 -
Orchestrator 对 MGR MySQL Group Replication的支持
Orchestrator一款是MySQL高可用highavailability软件,主要用于MySQLMaster-Slave主从架构。从开始初步支持MGRMySQLGroupReplication。但要求MySQL版本必须大于8.0。改动主要包括三部分,实例探测、故障扫描,以及故障处理。...原创 2022-07-31 21:21:54 · 505 阅读 · 0 评论 -
关于GitHub 服务中断 24 小时 11 分钟事故
目录1.背景MySQL集群部署情况Orchestrator部署情况2.事情的经过3.存在的隐患4.参考这起事故虽然发生在2018年,已经过去了很长时间,但其中的问题和带来的启示永不过时,拿来分析,具有很重要的意义。1.背景GitHub主要有东、西海岸两个数据中心,以及其他三个公有云数据中心。本次事故主要涉及东、西海岸两个数据中心。并且,在GitHub,使用的Orchestrator作为MySQL集群拓扑管理和主库高可用工具。GitHub 的MySQL集群和Orchestrator高可用服务部署情况原创 2021-11-28 20:55:01 · 523 阅读 · 0 评论 -
Orchestrator中 errant 的判断
在主从复制中,会在主库上写入数据,接着从库复制主库写入的数据。如果直接在从库上写入数据,从库中数据就会与主库不一致,出现 errant。errant 问题,主从数据不一致,需要及时发现和治理。如何判断 是否出现errant 呢?看起来比较简单,就是判断 从库 gtid 是否比主库gtid多,如果是,则判定为errant。但会有一种场景,如果先获取主库gtid,再获取从库gtid,由于这两个操作之间有时间差,从库会从主库复制数据,就会出现 从库的gtid 比主库的gtid多,出现误判。调整获取主库原创 2021-06-13 22:56:04 · 587 阅读 · 0 评论 -
Orchestrator 集群扩容后新节点无法加入集群 raft: Remote peer 10.23.116.176:10008 does not have local node
Orchestrator是基于Raft的分布式集群。现在原有三节点集群基础上,新扩容两个节点。所有节点更新配置文件,并重启后,新的节点无法加入集群。新节点报错信息;2020/09/04 15:22:53 [WARN] raft: Heartbeat timeout from "" reached, starting election2020/09/04 15:22:53 [INFO] raft: Node at 10.77.243.28:10008 [Candidate] entering Can原创 2020-09-06 15:56:58 · 348 阅读 · 4 评论 -
orchestrator中的raft snapshot操作
1.snapshot是什么snapshot是Raft log压缩的方式。压缩内容主要是Raft log 和应用状态数据(即orchestrator 中backend DB)。snapshot作用:定期清理raft log,减少空间占用备份raft节点状态,新节点加入时,快速应用备份和加入集群对于具体业务的影响,例如在orchestrator,原先从CMDB中导入的数据,可以快速在新节点或落后节点恢复切换时的防flapping,依赖topology_recovery数据表记录等2.什么时候原创 2020-08-09 22:10:50 · 343 阅读 · 0 评论 -
MySQL高可用工具--orchestrator
orchestrator是一款MySQL高可用工具,其支持:集群拓扑探测集群拓扑重塑故障恢复提供3种使用方式:命令行HTTP APIweb页面orchestator github地址原创 2019-03-30 21:11:40 · 909 阅读 · 0 评论 -
orchestrator raft leader频繁变化问题
最近在使用orchestrator的过程中,遭遇了严重的问题。最初上线的几个月里,raft leader非常稳定。但随着时间的推移,raft leader 频繁变化的问题就爆发了。leader的变化,直接原因,就是leader没有按时发送heartbeat,从而触发了选举机制。第一个怀疑的原因,就是网络抖动,出现丢包。但是,通过查看监控数据,发现没有丢包迹象。接着,通过tcpdump抓包,也证实没有数据丢失。第二个怀疑的是,raft的代码实现有问题。查看github仓库,已经很长时间没有relea原创 2020-07-04 23:26:59 · 471 阅读 · 3 评论 -
Orchestrator MySQL主库故障切换的几种类型
Orchestrator 对MySQL主库的故障切换分为自动切换和手动切换。手动切换又分为recover、force-master-failover、force-master-takeover以及graceful-master-takeover.1.自动切换自动切换是主库出现故障后,自动提升新主库,进行故的障切换。自动切换受到以下条件限制和约束:主库是downtime的集群不进行故障切...原创 2019-08-25 23:23:20 · 2137 阅读 · 0 评论