【第八期】Apache DolphinScheduler 每周 FAQ 集锦

点击蓝字 关注我们

c10ce9206c90d1944ab9172fd8c48f2a.png

摘要

为了让 Apache DolphinScheduler 的广大用户和爱好者对于此项目的疑问得到及时快速的解答,社区特发起此次【每周 FAQ】栏目,希望可以解决大家的实际问题。

关于本栏目的要点:

  1. 本栏目每周将通过腾讯文档(每周更新)从社区微信群收集 10-30 个问答,并在每周五整理具有典型代表意义的问答后发布,供大家参考。

  2. 所有人均可登录文档并提出问题,每人限 2 个提问,提问范围包括:

    1. 关于 Apache DolphinScheduler 的使用问题和技术性问题;

    2. 在实际应用中遇到的瓶颈问题;

    3. 参与社区贡献遇到的困难;

    4. 关于社区发展的疑问。

  3. 资源有限,请勿提问项目无关问题。

  4. 【每周FAQ】是一个社区互助的项目,发起宗旨是鼓励社区成员相互帮助,因此,欢迎大家积极踊跃志愿回答提出的疑问,在腾讯文档中写下答案即可。(高手们都别“潜水”了,出来露一手😜😎)

  5. 在社群里已经提问的问题,请勿在文档中重复提问,节约资源。

  6. 本栏目招募志愿者,有兴趣参与的小伙伴请加微信小助手 Leonard ds 报名。

5月20日-5月26日

有没有源码编译打包(选择zk版本)的操作文档呢?    

https://github.com/apache/dolphinscheduler/

blob/dev/CONTRIBUTING.md#build-with-different-zookeeper-versions     

目前部署的是3.1.5的版本, 使用的是 zookeeper3.8的版本,都是部署在k8s的环境里面 , 但DS如果配置了zk的集群地址, 就连不上,但可以确认这个zk的集群地址是没问题, 但DS的apiserver启动的时候,就是一直报连接zk超时,是不是3的版本对zk的配置有什么特别的地方呢?    

没有,请确定网络是否有问题,可以新建一个单节点同版本的 zk 连接测试下,应该没有问题的。    

单节点的海豚的工作流放到集群的海豚中,condition没有反应,但是前面的节点都显示加工完成了,这个是什么问题呢?   

看看日志,如果是3.1.x 版本的请提 issue 具体跟进。    

DS 3.1.0 ,单机版,worker 节点经常假死,进程还在,但是监控中心看不到,这个是 zk 丢失了worker节点心跳导致的吗?    

可能是,这个时候看看worker 日志,有心跳写入状态的日志的,以及 worker 服务器的负载。   

一个网卡,绑定多个IP时,增加work节点,识别出来的IP,不是我要用的IP,如何调整呢?    

所在节点上更改此配置文件

worker-server/conf/common.properties里面的# network interface preferred like eth0, default: empty#dolphin.scheduler.network.interface.preferred=。   

3.1.3 接口文档 访问地址是什么?http://xxxx/dolphinscheduler/doc.html 这个好像访问不了。    

http://{API server ip}:12345/dolphinscheduler/swagger-ui/index.html 请查看官方文档 https://dolphinscheduler.apache.org/en

-us/docs/3.1.7/guide/api/open-api    

DS 的定时调度无法执行,已经定时过的任务无法上线下线,但是可以手动点击执行,请问这种问题应该如何解决呢?    

看看不能执行的时候 master 的日志是什么问题,如果是 3.1.x 版本的请提 issue 具体跟进。    

资源中心能用mysql吗?    

不行,仅本地、hdfs、s3, oss。    

3.1.1版本上传300M以上的文件报错java.lang.OutOfMemoryError: Java heap space`,修改了dolphinscheduler-daemon.sh的api-server项内存大小参数。但是没有变化,还是报错,内存参数也没有改过来。    

修改下 api-server/start.sh 里面的内存大小看看。    

通过Docker部署的DolphinScheduler,怎么添加宿主服务器上DataX的环境变量呢?    

挂盘,能访问宿主目录就行,需要docker映射访问。    

目前使用海豚3.1.3版本,点击测试hive连接在hiveservice2里面产生了5个长链接没有关闭,生产环境跑sqltask也是这样连接被打满了,怎么解决?    

拉这个分支试一下,这个是去掉线程

池的pr:https://github.com/apache/dolphinscheduler/pull/14183    

DS 3.1.0 工作流定义好上线后执行,  工作流的实例里总没有生成,要重启DS后才能看到实例,是bug还是哪里的问题?    

看看 master 的日志是否有异常。    

Dolphinscheduler支持CAS单点登陆吗?    

目前开源版本没有,但是商业版本有,有商业版需要可以联系运营(微信17743592110)。    

DS怎么试运行?    

需要在 Ubuntu 或 Mac 系统下调试。    

怎么通过DS token实现前台免密登录?   

DS界面化上,有个授权界面,可以生成token的。在这个token的有效期内,是可以直接请求对应的接口的。系统A 要免密登到DS,流程:第一步:系统A通过某种途径获取到DS的token,并保存到系统A。第二步,系统A携带该token,跳转到ds界面 。问题:1.确认下在ds前端界面传的token与通过界面获取的token有无区别,2.如何获取到DS的token。3.理论上只要系统A与DS,都认可某个token,就可以实现免密登录的。或者给予DS与系统A,在开发出一个认证与授权服务,专门来做认证与授权(当然也包括免密登录),我个人更倾向这种方式。ds做调度,dlinky做在线开发,在搞个数据治理,SeaTunnel做数据集成,基本上就是数据中台的模型。    

3.1.5版本中,使用datax组件同步数据时,显示中文乱码,可能考虑原因有哪些?乱码格式:������������������     

在worker本地用命令行之行下 datax, 如果同样有问题就是你服务器编码缺少中文的问题。   

DS 3.1.2版本中,当一个任务流作为一个子任务并发执行的时候,后执行的任务流接收不到全局变量,什么原因?    

如果是说subprocess 参数传给父工作流的话,目前 3.1.x 还不支持,我们有一个开源之夏的课题会做这个事情,可查看详情报名:https://summer-ospp.ac.cn/org/orgdetail/22999f09-2be2-4dd8-b10f-bc4d6610cc25?lang=zh。    

数据质量模块可以配置问题数据入库的方式吗?如果要修改源码的话工作量大吗?大概在哪里子模块类中去修改?后续会不会在页面中增加配置问题数据的处理方式?    

数据质量只是做数据的校验,不清楚你问题数据是什么意思,如果是指数据质量写入result 表的逻辑的话,是在 dolphinscheduler-data-quality  这个module 中的。    

DS 3.1.6版本中zk注册失败是什么原因?    

可能是 zk 版本不兼容,3.1.6 推荐使用的版本是 3.8.0, 但是有用户发现低版本也可以

使用,另外想要用低版本可以用 

https://github.com/apache/dolphinscheduler/

blob/dev/CONTRIBUTING.md#build-with-different-zookeeper-versions 这个方式自行打包。    

jetty在什么情况下会跑着跑着自己就停了?有人用python程序作为业务进程,python进程去启动c++程序,c++程序可能会崩溃。他们自己本地执行这个py程序没问题,用worker调这个py程序,在c++程序崩溃后就会卡死。    

可以看看机器是否是否有运行一些别的命令,按道理不应该存在这种情况,除非本地和生产的资源不一样,而生产上的资源有瓶颈了。     

3.1.0版本中,使用海豚时出现Hive数据源连接池获取不到连接的情况,有什么建议避免?    

直接使用shell,升级或者二开。    

如果不想在worker 本地执行datax 任务,可以通过k8sTask类型节点 或者 ssh数据源解决吗?    

可以和hadoop nodemanager混部,算是弹性伸缩,晚上22点,nodemanager开启维护模式。ds关闭维护模式,开始抓取ds任务。早上8点,ds开启维护模式,nodemanager关闭维护模式,开始抓取yarn任务。    

参与贡献

随着国内开源的迅猛崛起,Apache DolphinScheduler 社区迎来蓬勃发展,为了做更好用、易用的调度,真诚欢迎热爱开源的伙伴加入到开源社区中来,为中国开源崛起献上一份自己的力量,让本土开源走向全球。

688046f58ee7c51f2ec9bcdd0309d041.png

参与 DolphinScheduler 社区有非常多的参与贡献的方式,包括:

b9ec95d6dd9eb76f8880b4d2df669994.png

贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。

社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689

非新手问题列表:https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22

如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/community/development/contribute.html

来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。

参与开源可以近距离与各路高手切磋,迅速提升自己的技能,如果您想参与贡献,我们有个贡献者种子孵化群,可以添加社区小助手微信(Leonard-ds) ,手把手教会您( 贡献者不分水平高低,有问必答,关键是有一颗愿意贡献的心 )。

09385c83b5fcc139de0c7d13a482b6ab.jpeg

添加社区小助手微信(Leonard-ds) 

添加小助手微信时请说明想参与贡献。

来吧,开源社区非常期待您的参与。

< 🐬🐬 >

更多精彩推荐

Apache DolphinScheduler 深圳 Meetup,走进OPPO不容错过的大数据盛宴!

☞优秀用户案例有奖征集 | 活动火热开启,快来投稿!

Apache DolphinScheduler 发布 3.1.6 版本,支持 SeaTunnel Zeta 引擎

☞Apache DolphinScheduler 荣获 2022 年中国开源创新大赛二等奖!

☞去年办了这么多场Meetup都没有你,2023年赶紧安排起来!

☞企业级应用如何用 Apache DolphinScheduler 有针对性地进行告警插件开发?

CommunityOverCode Asia 2023 强势来袭!15 大专题议题征集 6 月 6 日截止

我知道你在看6284059f15233f3434a4086167c88678.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

DolphinScheduler社区

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值