Apache DolphinScheduler对比Azkaban、Airflow

最新推荐文章于 2025-03-17 21:04:48 发布

追求进步的阶梯

最新推荐文章于 2025-03-17 21:04:48 发布

阅读量9.4k

点赞数 7

文章标签：大数据可视化分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/d66380022/article/details/108510211

版权

	DolphinScheduler	Azkaban	Airflow
稳定性
单点故障	去中心化的多Master和多Worker	是单个Web和调度程序组合节点	是单一调度程序
HA额外要求	不需要(本身就支持HA)	DB	Celery / Dask / Mesos + Load Balancer + DB
过载处理	任务队列机制，单个机器上可调度的任务数量可以灵活配置，当任务过多时会缓存在任务队列中，不会造成机器卡死	任务太多时会卡死服务器	任务太多时会卡死服务器
易用性
DAG监控界面	任务状态、任务类型、重试次数、任务运行机器、可视化变量等关键信息一目了然	只能看到任务状态	不能直观区分任务类型
可视化流程定义	是所有流程定义操作都是可视化的，通过拖拽任务来绘制DAG,配置数据源及资源。同时对于第三方系统，提供api方式的操作。	否通过自定义DSL绘制DAG并打包上传	否通过python代码来绘制DAG，使用不便，特别是对不会写代码的业务人员基本无法使用。
快速部署	一键部署	集群化部署复杂	集群化部署复杂
功能
是否能暂停和恢复	支持暂停，恢复操作	否只能先将工作流杀死再重新运行	否只能先将工作流杀死再重新运行
是否支持多租户	支持 easyscheduler上的用户可以通过租户和hadoop用户实现多对一或一对一的映射关系，这对大数据作业的调度是非常重要的。	否	否
任务类型	支持传统的shell任务，同时支持大数据平台任务调度： MR、Spark、SQL(mysql、postgresql、hive、sparksql)、Python、Procedure、Sub_Process	shell、gobblin、hadoopJava、java、hive、pig、spark、hdfsToTeradata、teradataToHdfs	BashOperator、DummyOperator、MySqlOperator、HiveOperator、EmailOperator、HTTPOperator、SqlOperator
契合度	支持大数据作业spark,hive,mr的调度，同时由于支持多租户，与大数据业务更加契合	由于不支持多租户，在大数据平台业务使用不够灵活	由于不支持多租户，在大数据平台业务使用不够灵活
扩展性
是否支持自定义任务类型	是	是	是
是否支持集群扩展	是调度器使用分布式调度，整体的调度能力会随便集群的规模线性增长，Master和Worker支持动态上下线	是，但是复杂 Executor水平扩展	是，但是复杂 Executor水平扩展

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。