kettle分批处理大表数据_KETTLE——Weka处理大数据量内存溢出问题 | 学步园

现在做的一个项目ETL采用KETTLE,通过Perl脚本进行分天表、月表及年表的创建,并修改KETTLE创建的抽取任务模板。即使这样在处理天表表近百万数据量时,Kettle也会有时发生内存溢出现象,导致抽取任务失败。今天发现了一哥们BLOG中的解决办法,特分享。

以Spoon.bat为例,其他组件和.sh操作类似

用文本编辑器打开Spoon.bat找到:

REM ******************************************************************

REM ** Set java runtime options                                     **

REM ** Change 256m to higher values in case you run out of memory.  **

REM ******************************************************************

set OPT=-Xmx1444m -cp %CLASSPATH% -Djava.library.path=libswt\win32\ -DKETTLE_HOME="%KETTLE_HOME%" -DKETTLE_REPOSITORY="%KETTLE_REPOSITORY%" -DKETTLE_USER="%

KETTLE_USER%" -DKETTLE_PASSWORD="%KETTLE_PASSWORD%" -DKETTLE_PLUGIN_PACKAGES="%KETTLE_PLUGIN_PACKAGES%"

修改这里的数字...-Xmx1444m...

我装的是jdk-1_5_0_14这里的1444m是极限了.大家可以在自己的机器上试验不同的数值.

WEKA(感谢网友:comcome84)

用文本编辑器打开RunWeka.ini找到:

# placeholders ("#bla#" in command gets replaced with content of key "bla")

# Note: "#wekajar#" gets replaced by the launcher class, since that jar gets

#       provided as parameter

maxheap=1444m

这里同样被我修改成1444m.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值