最近搜了搜kettle,发现其版本有很大的区别,无论是从哪方面来说,我现在正在用的是4.x版本,发现其中就有很多
没有涉及到的东西,而5.x中就有很多4中没有的东西,比如,5.x中就有链接hadoop的控件,可以和hadoop实现对接,
在csdn中看到的一片文章中有很详细的介绍(http://blog.csdn.net/xiaohai798/article/details/39558939)觉得里面写的很好,
而4.x中就没有与其对接的控件,所以,就我个人来说,在这个大数据炒的火热,hadoop发展迅速的时代,还是推荐使用
5.x的kettle(下载地址:http://sourceforge.net/projects/pentaho/files/Data%20Integration/),还有就是自己现在在做一个
关于数据预处理的东西,越发觉得kettle的好用。
然后就是低版本不能调用高版本的程序,所以还是推荐5.x。自己最近也要上手5.x,
所以,开始kettle之旅吧!