azkaban提高并行job数

一.现象

 

原来azkaban的job默认为10,我们需要增大来作为兼容,但是要小心oom的情况发生。所以要注意监控机器。

 

二、来看下介绍

1. Executor Server配置
配置    解释    默认
executor.port    executor server端口    12321
executor.global.properties    全局的配置    无
azkaban.execution.dir    正在执行的job的工作目录    executions
azkaban.project.dir    保存工程的被执行的文件的临时目录    projects
executor.flow.threads    流式执行的线程数    30
job.log.chunk.size    滚动输出的日志的size    5MB
job.log.backup.index    每个日志块的分片    4
flow.num.job.threads    并发运行的flow的jobs的线程    10
job.max.Xms    每个job初始化的内存空间,如果job需要更多的空间,azkaban Server不会启动这个job    1GB
job.max.Xmx    每个job可以申请的最大内存空间,如果job需要更多的空间    azkaban server不会启动这个job
 

三、修改

# default 10 but we need faster
flow.num.job.threads=20
 

 

 

四、重启

./bin/az...start.sh

然后就能同时跑20个job了。

 

发现任务又提速了13秒左右,很棒!继续优化,spark优化。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值