datax参数调优

dantax参数调优

1.speed调优

在这里插入图片描述
可能会导致数据倾斜
处理的速度不同,可能会导致job非常慢

举例子,比如总限速是每秒100条record,其中第一个channel速度是每秒99条record,第二个channel是每秒1条record,加起来是每条100条record,假设每个channel需要处理的数据都是1万条数据,那么第一个channel很早就处理完了,第二个channel会消耗比较长的时候,类似hadoop中的数据倾斜,为了避免这个问题,我们需要配置单个channel的限速
在这里插入图片描述
在这里插入图片描述

内存优化

当提升Datax Job内Channel并发数时,内存的占用会显著增加,因为datax作为数据交换通道,在内存中会缓存较多的数据。例如Channel中会有一个Buffer,作为临时的数据交换的缓冲区,而在部分Reader和Writer中,也会存在一些Buffer,为了防止OOM等错误,需要调大JVM的堆内存

  1. 建议将内存设置为4G或者8G
  2. 建议在启动的时候,加上对应的参数:python datax/bin/datax.py --jvm=“-Xms8G -Xmx8G” /path/to/your/job.json
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ysksolution

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值