任务调度
文章平均质量分 89
任务调度
DATA数据猿
路漫漫其修远兮,吾将上下而求索。
探索学习中的一枚数据猿,希望得到你的指点。
展开
-
《任务调度-DolphinScheduler》DolphinScheduler1.3 元数据文档
DolphinScheduler 1.3元数据文档。原创 2022-09-03 16:09:38 · 2606 阅读 · 0 评论 -
《任务调度-DolphinScheduler》DolphinScheduler实例表备份、清理
通过` select data into outfile file.txt、load data infile file.txt into table `的方式备份表中全部数据,为什么采用这种备份方案呢?因为我这里只想要备份`t_ds_process_instance`和`t_ds_task_instance`两张表,表数据量达到百万级别,通过文件导入导出的备份效率比较高,用于备份全量数据。原创 2022-09-03 15:50:07 · 2026 阅读 · 0 评论 -
《任务调度-DolphinScheduler》Apache DolphinScheduler选型与部署安装
想在项目中使用DS这种调度方法,通过比对几种技术,例如:NIFI,Azkaban,Airflow。NIFI虽然做的是最完善的,但是太重了,出现问题之后就需要用源码定位费劲,维护/二次开发成本高。AirFolw是Python写的,公司里大部分是Java体系和Scala体系,所以就放弃了。Apache DolphinScheduler,为Apache的开源项目,简称DS,中文名为“小海豚调度”(海豚聪明,人性化,又左右脑可相互换班,终生不用睡觉)。原创 2022-03-20 14:31:15 · 6331 阅读 · 0 评论 -
Azkaban
Azkaban1 Azkaban定义一个完整的大数据项目,它是由许多不同的任务单元组成;比如:shell脚本,mapreduce程序,hive脚本,spark程序等哪些单元先做,哪些单元后做,需要由既定的流程,这个流程的指定就靠Azkaban这样的工作流调度工具来完成。2 常见的工作流工具crontab\oozie\azkaban\airflow等3 Azkaban官网MySQL:Azkaban使用MySQL来存储项目和执行Azkaban Web服务器:Azkaban使用Jet原创 2021-07-28 21:56:10 · 168 阅读 · 0 评论