【每周 FAQ】第二期 | 回答你关于 Apache DolphinScheduler 的疑问

点击蓝字 关注我们

fccba7b81afb3745496ec5ecabe59996.png

摘要

为了让 Apache DolphinScheduler 的广大用户和爱好者对于此项目的疑问得到及时快速的解答,社区特发起此次【每周 FAQ】栏目,希望可以解决大家的实际问题。

关于本栏目的要点:

  1. 本栏目每周将通过腾讯文档(每周更新)从社区微信群收集 10-30 个问答,并在每周五整理具有典型代表意义的问答后发布,供大家参考。

  2. 所有人均可登录文档并提出问题,每人限 2 个提问,提问范围包括:

    1. 关于 Apache DolphinScheduler 的使用问题和技术性问题;

    2. 在实际应用中遇到的瓶颈问题;

    3. 参与社区贡献遇到的困难;

    4. 关于社区发展的疑问。

  3. 资源有限,请勿提问项目无关问题。

  4. 【每周FAQ】是一个社区互助的项目,发起宗旨是鼓励社区成员相互帮助,因此,欢迎大家积极踊跃志愿回答提出的疑问,在腾讯文档中写下答案即可。(高手们都别“潜水”了,出来露一手😜😎)

  5. 在社群里已经提问的问题,请勿在文档中重复提问,节约资源。

  6. 本栏目招募志愿者,有兴趣参与的小伙伴请加微信小助手 Leonard ds 报名。

FAQ(4月8日-4月14日)

我想把平台上的Airflow换成DolphinScheduler,有教程吗?

可参考迁移工具 Air2phin 宣布开源,2 步迁移 Airflow 至 Dolphinscheduler

希望DolphinScheduler的项目管理里面每个项目下面可以实现多层次管理,每个项目下面再细分调度分组或者文件夹形式查看每个调度当前执行情况,社区有相关计划吗?

目前没有计划,开源软件不会对权限和资源有太多的控制(除非专门干这个事情的软件),可以了解一下白鲸开源的商业版本,有更加细粒度资源控制。    

企业微信机器人告警能配置吗?

DolphinScheduler企业微信告警组件,目前只支持创建微信应用的方式,群机器人还无法实现。钉钉机器人组件与微信告警组件发送信息的结构差不多,缺点就是告警信息只能用纯文本,而且没法@群成员。需要注意的是,DolphinScheduler 3.1.4版本的告警信息字段默认拼装在json的根节点,企业微信告警机器人需要把信息字段放在json串的次节点上。

希望DolphinScheduler的任务组件不依赖DataX去抽取数据,有自己的抽取数据任务,例如SQL抽取入库,hdfs抽取入库,jdbc抽取入库,文件入库,kafka实时入库,抽取数据源实时写入kafka中等,有相关规划吗?    

目前没有相关规划,DolphinScheduler本身是一个任务调度软件,不宜过多关注外部操作,如果不想用DataX,可以尝试使用 SeaTunnel。另外如果你的数据库本身支持,如 redshift 也可以直接做 ELT。    

Flink 组件是否支持 Flink on Yarn 模式下的SQL 任务?    

支持,Flink任务类型中有SQL提交模式,选Cluster。    

使用DolphinScheduler 1.3.3 版本,按照官网的upgrade SQL 执行完之后,页面页面数据显示不出来,元数据中的json 对象格式不一样,有没有详细的升级方法?

1.3是比较旧的版本,建议逐步升级的策略,先升级到 2.0.0 后观察是否运行有问题,没有再升级到 3.0.0。可能出问题的主要是 2.0.0 dag的拆分。    

DolphinScheduler 3.1.x 之后Hive-jdbc版本如果过高,会导致集群中Hive 连接报错,Hive 中能否支持选定Hive 版本?

目前SQL任务不支持指定版本,但是这个问题可以通过替换Hive jdbc jar版本解决。    

海豚本身的连接池是不是有探活功能呀?  

有的,监控中心,db 就有状态检测。    

海豚的压测,有哪位大佬做过么?

可参考最新性能测试 | Apache DolphinScheduler 每分钟调度任务并发是 Apache Airflow 2 倍

DolphinScheduler现在支持Flink on k8s的调度吗?    

DolphinScheduler只是任务调度,和Flink的部署方式无关, 我们只是提交作业给 Flink。如果是指管理 k8s 集群,可以期待一下未发版版本中的集群管理功能。    

每周 FAQ 回顾:

【每周 FAQ】第一期 | 回答你关于 Apache DolphinScheduler 的疑问

参与贡献

随着国内开源的迅猛崛起,Apache DolphinScheduler 社区迎来蓬勃发展,为了做更好用、易用的调度,真诚欢迎热爱开源的伙伴加入到开源社区中来,为中国开源崛起献上一份自己的力量,让本土开源走向全球。

e637bd49a5ffbd0f86a312f9a95619a5.png

参与 DolphinScheduler 社区有非常多的参与贡献的方式,包括:

07cd41acd35fb12600217eee50559594.png

贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。

社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689

非新手问题列表:https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22

如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/community/development/contribute.html

来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。

参与开源可以近距离与各路高手切磋,迅速提升自己的技能,如果您想参与贡献,我们有个贡献者种子孵化群,可以添加社区小助手微信(Leonard-ds) ,手把手教会您( 贡献者不分水平高低,有问必答,关键是有一颗愿意贡献的心 )。

4067fe5ff6d4bff588f5e943d78211cf.jpeg

添加社区小助手微信(Leonard-ds) 

添加小助手微信时请说明想参与贡献。

来吧,开源社区非常期待您的参与。

< 🐬🐬 >

更多精彩推荐

Apache DophinScheduler Meetup 成都站— 批流一体与大数据调度最佳实践

☞优秀用户案例有奖征集 | 活动火热开启,快来投稿!

Apache DolphinScheduler 从 1.3.4 升级至3.1.2 过程中的问题记录及解决方案

☞Apache DolphinScheduler 3.1.5 发布,修复工作流实例甘特图查看异常等问题

☞去年办了这么多场Meetup都没有你,2023年赶紧安排起来!

☞为什么工作流中的数据质量要尽早验证,经常验证?

DolphinScheduler×思科网讯:k8S整合实践,提高大数据处理效率!

点击阅读原文,点亮Star支持我们哟c3a85cd2b3bf9727036b85af881b0191.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Apache DolphinScheduler是一个新一代分布式大数据工作流任务调度系统,致力于“解决大数据任务之间错综复杂的依赖关系,整个数据处理开箱即用”。它以 DAG(有向无环图) 的方式将任务连接起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及 Kill任务等操作。目前已经有像IBM、腾讯、美团、360等400多家公司生产上使用。 调度系统现在市面上的调度系统那么多,比如老牌的Airflow, Oozie,Kettle,xxl-job ,Spring Batch等等, 为什么要选DolphinSchedulerDolphinScheduler 的定位是大数据工作流调度。通过把大数据和工作流做了重点标注. 从而可以知道DolphinScheduler的定位是针对于大数据体系。 DolphinScheduler是非常强大的大数据调度工具,有以下一些特点:1、通过拖拽以DAG 图的方式将 Task 按照任务的依赖关系关联起来,可实时可视化监控任务的运行状态;2、支持丰富的任务类型;3、支持工作流定时调度、依赖调度、手动调度、手动暂停/停止/恢复,同时支持失败重试/告警、从指定节点恢复失败、Kill 任务等操作;4、支持工作流全局参数及节点自定义参数设置;5、支持集群HA,通过 Zookeeper实现 Master 集群和 Worker 集群去中心化;6、支持工作流运行历史树形/甘特图展示、支持任务状态统计、流程状态统计;7、支持补数,并行或串行回填数据。课程会带大家构建DolphinScheduler大数据调度平台,实战讲解多种任务调度配置,会基于案例讲解DolphinScheduler使用,让大家在实战中掌握DolphinScheduler。 DolphinScheduler 发展很快 很多公司调度都切换到了DolphinScheduler,掌握DolphinScheduler调度使用势在必行,抓住新技术机遇,为跳巢涨薪做好准备。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

DolphinScheduler社区

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值