penatho data integration
12345677654321000000
这个作者很懒,什么都没留下…
展开
-
centos安装penatho data integration (kettle)
最近工作要用到ETL工具,pentaho data integration ,即kettle。用来控制hadoop2.2.0的作业,并且处理和mysql数据库的交互。首先说明一点,pentaho分为EE版和CE版,EE版能够免费使用30天,包含其他BI套件。而CE版则只有一个Spoon工具(个人理解,错误请指正)。 下载地址EE版:http://www.pentaho.com/do原创 2013-12-25 14:33:25 · 3934 阅读 · 0 评论 -
pentaho data integration连接hadoop2.2.0
pdi即kettle,支持hadoop的操作,但是默认支持的是hadoop0.2.0。但是由于我目前所用的是hadoop2.2.0,主要想用pdi来控制hadoop的作业调度。经过几天痛苦的试探过程,目前能够初步实现这个功能。 经本人测试,按照下面修改之后,可以使用transformation中Big Data组件中的Hadoop File Input和Hadoop File Ou原创 2013-12-25 15:03:12 · 2184 阅读 · 7 评论