
--------【大数据任务调度架构】
大数据任务调度,工作流任务调度,Apache DolphinScheduler
代立冬
StayHungryStayFoolish外功修行内功修神
展开
-
Apache DolphinScheduler 1.3.2 发布,架构升级,性能提升 2~3 倍
引言大数据任务调度作为大数据建设中的核心基础设施,在经过社区用户们长期的使用中,不少用户对调度也提出了很多新的要求,为此,Apache DolphinScheduler(Incubating)经过长达 5 个多月的辛苦努力, 终于发布了 1.3.2 正式版本。DolphinScheduler-1.3.2 有超过 30 名贡献者参与开发,性能较 1.2 版本有 2 ~ 3 倍的提升,相对 1.2 版本,1.3.x 增加了诸如 K8s支持、多目录管理等重要的新特性和新的任务类型。1.3.x 重要的改动如下.原创 2020-09-10 14:40:58 · 3050 阅读 · 1 评论 -
从开源使用者到Apache PPMC之路
近日, 观远数据联合创始人&首席架构师吴宝琪, 作为Apache DolphinScheduler 的PPMC(项目管理委员会)成员参加了Apache DolphinScheduler 的首届用户大会, 并在大会上做了《从开源使用者到Apache PPMC之路》的分享。Apache软件基金会创建于1999年,是专门为支持开源软件项目而创办的一个非营利性组织,也是世界上最...转载 2019-11-24 19:54:22 · 1425 阅读 · 0 评论 -
Easy Scheduler 1.1.0 Release发布,分布式工作流任务调度系统
Easy Scheduler Release 1.1.0Easy Scheduler 1.1.0是1.1.x系列中的第一个版本。新特性:[EasyScheduler-391] run a process under a specified tenement user[EasyScheduler-288] Feature/qiye_weixin[EasyScheduler-189] Ke...原创 2019-08-08 08:06:15 · 1234 阅读 · 0 评论 -
现在Easy Scheduler想贡献给Apache基金会,我们做了一份问卷看下大家的想法,也请大家积极参与,谢谢!
感谢各位伙伴们长期以来的持续关注和贡献,现在Easy Scheduler想贡献给Apache基金会,我们做了一份问卷看下大家的想法,也请大家积极参与,谢谢!https://wj.qq.com/s2/4190958/5588/也欢迎大家直接去https://github.com/analysys/EasyScheduler/issues/638 进行投票...原创 2019-08-02 17:41:16 · 809 阅读 · 0 评论 -
分布式工作流任务调度系统 Easy Scheduler 1.1.0 预览版发布
Easy Scheduler Release 1.1.0-PreviewEasy Scheduler 1.1.0-Preview是1.x系列中的第六个版本。新特性:[EasyScheduler-391] run a process under a specified tenement user[EasyScheduler-288] Feature/qiye_weixin[EasySch...原创 2019-07-16 17:35:44 · 969 阅读 · 0 评论 -
分布式任务调度EasyScheduler贡献代码流程
首先从远端仓库https://github.com/analysys/EasyScheduler.git fork一份代码到自己的仓库中远端仓库中目前有三个分支:master 正常交付分支发布稳定版本以后,将稳定版本分支的代码合并到master上。dev 日常开发分支日常dev开发分支,新提交的代码都可以pull request到这个分支上。branch-1....原创 2019-07-05 11:20:26 · 1936 阅读 · 0 评论 -
Easy Scheduler 1.0.3 发布,分布式工作流任务调度系统
Easy Scheduler Release 1.0.3Easy Scheduler 1.0.3是1.x系列中的第四个版本。新特性:[EasyScheduler-254] 流程定义删除和批量删除[EasyScheduler-347] 任务依赖增加“今日”[EasyScheduler-273]sql任务添加title[EasyScheduler-247]API在线文档[EasySch...原创 2019-05-28 08:26:44 · 1166 阅读 · 1 评论 -
开源分布式工作流任务调度系统Easy Scheduler Release 1.0.2发布
Easy Scheduler Release 1.0.2Easy Scheduler 1.0.2是1.x系列中的第三个版本。此版本增加了调度开放接口、worker分组(指定任务运行的机器组)、任务流程及服务监控以及对oracle、clickhouse等支持,具体如下:新特性:[EasyScheduler-79] 调度通过token方式对外开放接口,可以通过api进行操作[EasySche...原创 2019-04-26 20:08:20 · 1109 阅读 · 0 评论 -
持续改进中——Easy Scheduler 1.0.1版本来了
持续改进中——Easy Scheduler 1.0.1版本来了背景在多位技术小伙伴的努力下,经过近2年的研发迭代、内部业务剥离及重构,也经历一批种子用户试用一段时间后,EasyScheduler终于迎来了第一个正式开源迭代发布版本 – 1.0.1,免编译版本下载地址 – 1.0.1相信做过数据处理的伙伴们对开源的调度系统如oozie、azkaban、airflow应该都不陌生,在使用这些调...原创 2019-04-17 10:54:37 · 1780 阅读 · 1 评论 -
分布式工作流任务调度系统Easy Scheduler正式开源
Easy Scheduler大数据工作流调度系统已经开源,欢迎下载交流 https://github.com/analysys/EasySchedulerEasy Scheduler for Big Data设计特点: 一个分布式易扩展的可视化DAG工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。其主要目标如下:以DAG图的方...原创 2019-03-29 23:56:37 · 3988 阅读 · 1 评论 -
承载每天10万级任务的数据调度系统的架构是如何设计的
EasyScheduler大数据调度系统架构分享导语EasyScheduler是易观平台自主研发的大数据分布式调度系统。主要解决数据研发ETL 错综复杂的依赖关系,而不能直观监控任务健康状态等问题。EasyScheduler以DAG流式的方式将Task组装起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及Kill任务等操作。背景任务调度系统在大数据平台当中是一个核心的...原创 2018-12-13 20:01:57 · 35127 阅读 · 16 评论 -
大数据工作流任务调度--有向无环图(DAG)之拓扑排序
拓扑排序(Topological Sorting)维基百科上拓扑排序的定义为:对于任何有向无环图(DAG)而言,其拓扑排序为其所有结点的一个线性排序(同一个有向图可能存在多个这样的结点排序)。该排序满足这样的条件——对于图中的任意两个结点U和V,若存在一条有向边从U指向V,则在拓扑排序中U一定出现在V前面。通俗来讲:拓扑排序是一个有向无环图(DAG)的所有顶点的线性序列, 该序列必须满足两个...原创 2019-01-20 22:47:02 · 6866 阅读 · 2 评论