大数据调度平台oozie、azkaban、dolphinscheduler、AirFlow对比

 Apache Oozie#

 

 

 Linkedin Azkaban

#

 

 

 Azkaban:最适合shell脚本,当job不多的时候,可以使用。

 Apache Airflow

#

 

 

 

 

 Airflow 在使用时有一大痛点:使用Python语言来定义工作流的。

 

 Apache DolphinScheduler

#

 

 特点:分布式、去中心化、易扩展的可视化工作流任务调度系统

 

 

海豚调度的多租户和我们YARN的多租户是对应起来的,这个非常好。

海豚调度出来的有点迟,它把我们之前讲的 Oozie、Azkaban、airflow的优点全拿过来了,后发优势,集万千优点于一身,缺点也避免了。

离线:用的Spark比较多,实时用 Flink比较多。

过载处理:airflow 任务过多时卡死服务器,DolphinScheduler任务队列机制,当任务过多时会缓存在任务队列中。

推荐海豚DolphinScheduler任务器~~~~

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
OozieAzkabanDolphinScheduler都是大数据平台上的定时调度系统,具有如下特点: 1. OozieOozie是一个基于Hadoop的工作流引擎,可以用来管理和调度Hadoop作业。它支持多种作业类型,如MapReduce、Hive、Pig等,并提供了可视化的工作流设计器,使得用户可以通过简单的拖拽和配置来创建工作流。Oozie的缺点是部署和配置比较复杂,需要较高的技术水平。 2. AzkabanAzkaban是一个基于Hadoop的批处理作业调度器,支持多种作业类型,如MapReduce、Pig、Hive等。它提供了Web界面,使得用户可以方便地创建和管理作业。Azkaban的优点是易于使用,但缺点是在大规模作业和复杂的依赖关系下性能较差。 3. DolphinSchedulerDolphinScheduler是一个开源的分布式调度系统,支持多种作业类型,如Shell、PySpark、Flink等。它提供了可视化的工作流设计器和Web界面,使得用户可以通过简单的拖拽和配置来创建工作流。DolphinScheduler的优点是易于使用、支持分布式部署和高可用,但缺点是相对较新,社区支持相对较弱。 总的来说,OozieAzkabanDolphinScheduler都是可靠的定时调度系统,应该根据具体需求和场景来选择使用。如果需要支持多种作业类型和具备较高的灵活性,可以选择DolphinScheduler;如果需要易于使用和管理,可以选择Azkaban;如果需要支持大规模作业和较高的可靠性,可以选择Oozie

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值