性能高优在整个工程中是非常重要的,也是非常有必要的。但有的时候我们往往都不知道如何对性能进行调优。其实性能调优主要分两个方面:一方面是硬件调优,一方面是软件调优。本弹主要是介绍Kettle工具性能调优。
关于Kettle性能调优方法有以下几点:
1、 调整JVM大小进行性能优化,修改Kettle定时任务中的Kitchen与Pan脚本中。
修改脚本代码片段 |
REM ****************************************************************** REM ** Set java runtime options ** REM ** Change 512m to higher values in case you run out of memory. ** REM ******************************************************************
set OPT=-Xmx512m -cp %CLASSPATH% -Djava.library.path=libswt\win32\ -DKETTLE_HOME="%KETTLE_HOME%" -DKETTLE_REPOSITORY="%KETTLE_REPOSITORY%" -DKETTLE_USER="%KETTLE_USER%" -DKETTLE_PASSWORD="%KETTLE_PASSWORD%" -DKETTLE_PLUGIN_PACKAGES="%KETTLE_PLUGIN_PACKAGES%" -DKETTLE_LOG_SIZE_LIMIT="%KETTLE_LOG_SIZE_LIMIT%" |
参数参考: -Xmx1024m:设置JVM最大可用内存为1024M。 |
样例:OPT=-Xmx1024m -Xms512m |
2、 调整提交(Commit)记录数大小进行优化
如修改RotKang_Test01中的“表输出”组件中的“提交记录数量”参数进行优化,Kettle默认Commit数量为:1000,可以根据数据量大小来设置Commit size:1000~50000。
(图11.0)
3、 调整记录集合里的记录数
(图11.1)
4、 调整SQL查询脚本是否走索引(非常关键性的优化),这里我就不多讲关于SQL脚本优化。
以上几点是我使用Kettle这几年的对性能方面优化总结,可提供给大家进行参考。