大数据调度系统

有了数据平台、数据仓库之后,还需要一个系统来调度和管理数仓的任务。现有的开源调度系统:

dolphin、hera、airflow、oozie、zeus、azkaban。

1. 调度系统功能图

调度系统负责抽取数据到数据仓库,日志就是我们可能要抽取埋点日志等,经过数据仓库加工聚合之后,数据可以导入报表、导出到主站等。

2. 调度系统架构图

 

apiservice服务主要给页面提供接口访问,对创建的任务的调度进行CRU等操作;

Alertservice 服务对失败的任务进行邮件短信告警。

Logservice 服务主要收集 worker 运行任务的日志。

Master:有HA的,接收apiservice提交的任务,分发到对应的节点进行调度。、

worker:执行任务,包括 datax 同步任务,shell 任务和 hive SQL 任务。

原文:

大数据应用篇之调度系统 - 知乎 (zhihu.com)

主流大数据调度工具对比DolphinScheduler Azkaban Airflow Oozie Xxl-job_dolphinscheduler和xxl-job_import80的博客-CSDN博客

flow概念:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值