文章目录 **DolphinScheduler****集群高可用测试** **1 文档概述** 2 测试环境说明 3 测试场景说明 4 高可用测试 4.1 API 管理角色的高可用性测试 **测试前置:**在测试API角色之前需要确保DS集群中已部署了两个API角色,否则在测试的过程中模拟API 说明:测试阶段就未引入Haproxy或F5实现前端页面访问的负载均衡,因此本测试用例均是直接访问相 4.1.1 确认两个API服务均正常运行 4.1.2 访问 192.168.1.XX 的API服务的前端在项目中运行一个调度 4.1.3 登录 192.168.1.XX 节点,找到API服务的进程,并kill掉该进程,模拟服务异常 4.1.4 登录192.168.0.121节点的API服务,确认作业在120节点上启动的作业是否已成功运行 4.2 Master****管理角色的高可用性测试** 4.2.1 **测试前置:**Master服务采用分布式无中心模式,MasterServer服务启动时向Zookeeper注册临时节点, 4.1.2 在API的WEB UI上连续的提交多个DAG工作流 4.1.3 登录到192.168.0.120的Master节点上,找到该服务的进程并Kill掉 4.1.4 通过刷新WEB界面可以看到,出现“恢复被容错的工作流” 4.3 Worker角色的高可用性测试** 4.3.1 通过DS的前端界面运行两个DAG工作流 4.3.2 将192.168.0.120和192.168.0.121节点的Worker服务杀掉 4.3.4 查看作业也运行成功 4.3.5