kettle
我要的shine
已经步入社会啦,现在是一名小测试~
展开
-
linux下部署kettle
自己也是刚学习kettle不久,还没有精通,以下是我linux下部署kettle的学习笔记和心得,接下来就让我们开始吧!一、首先先看一下允许kettle的最低版本的JDK,编辑查看spoon.bat可以看到可以看出,最低版本是1.6的JDK,所以安装的JDK版本应该在1.6之上二、登录linux(直接在root用户下操作即可)1、 安装JDK(这里就不多说关于安装ja原创 2015-10-28 22:11:20 · 6494 阅读 · 1 评论 -
用kettle处理重复值和空缺值
原来的文档是这样的此处是重复此处为空缺值接下来是处理步骤:过滤记录为除去空缺值,而Unique rows则是除去重复值处理完成后为重复的值自然也没有啦此方法只是我自己的想法,如果有好的想法,还希望彼此交流下原创 2015-11-10 19:22:16 · 4656 阅读 · 0 评论 -
kettle中行扁平化使用
行扁平化也是自己摸索着进行的,有不足的地方还奇怪大神指教。原来的excel表格是这样的现在我们把它转换一下,我做的流程是这样的其中行扁平化是这样的所以,处理之后就变成了所以行扁平化可以用作做表头。并且如果数据没有什么缺陷,那么做出来就应该是很完整的!原创 2015-11-20 18:06:42 · 4122 阅读 · 0 评论 -
kettle版本的区别
最近搜了搜kettle,发现其版本有很大的区别,无论是从哪方面来说,我现在正在用的是4.x版本,发现其中就有很多没有涉及到的东西,而5.x中就有很多4中没有的东西,比如,5.x中就有链接hadoop的控件,可以和hadoop实现对接,在csdn中看到的一片文章中有很详细的介绍(http://blog.csdn.net/xiaohai798/article/details/39558939)原创 2015-11-18 20:07:22 · 9715 阅读 · 2 评论 -
kettle excel
自己正在做一个关于数据预处理的东西,正在清洗数据,发现kettle4.x 中excel只能处理65536行数据,多的话就会出现错误,所以在这补充一下,还是像上个文章说的尝试用5.x虽然5.x也是计划要用,感觉还是应该比4.x要好些。原创 2015-11-20 18:08:22 · 1008 阅读 · 0 评论