Kettle(Pentaho DataIntegration) 安装Hadoop-2.2.0插件

36 篇文章 0 订阅
30 篇文章 0 订阅



1 安装前的准备工作

   1.1 Pentaho Data Integration

当前的CE 版本Pentaho Data Integration 5.0.1,下载地址:

http://www.pentaho.com/download/。你也可以尝试企业版EE,这里不做介绍了。下载完成后,压缩到指定的目录下。

   1.2 Hadoop 2.2.0

下载最新稳定版本的Hadoop 2.2.0,下载地址:

https://hadoop.apache.org/releases.html

安装步骤

2.1 配置 PID Hadoop插件

   进入hadoop-configurations目录下,复制chd42,并重命名为hadoop-2.2.0

并且清空client目录下的jar包。完成后,将Hadoop安装目录下share目录下的所有jar包复制到client目录下,包括hadoop libjar包。清除client同级别的jar中的protobuf-java-2.4.0.jar使用protobuf-java-2.5.0.jar替代。

2.2 添加配置

hadoop的安装目录下的配置文件复制到PID的插件hadoop-2.2.0 下,hadoop安装路径etc/hadoop/,重要的文件包括:

core-site.xml,hdfd-site.xml,mapred-site.xml,yarn-site.xml,slaves等,到hadoop-2.2.0目录下。

2.3 修改PID插件的配置文件

      ~/data-integration/plugins/pentaho-big-data-plugin目录下,找到plugin.properties文件。修改一行数据:     

    active.hadoop.configuration=hadoop-2.2.0



3.测试

     测试这个配置是否成功,最简单的方法是建立job任务。创建一个job, 添加开始按钮和Hadoo copy File 组件。

 

点击浏览HDFS文件按钮,弹出框中配置Hadoop链接配置,点击Connect按钮。如果成功的话,下面的面板中会显示HDFS的树形文件结构。




                

    

 

       转载,请写明出处:http://blog.csdn.net/greatelite/article/details/18676005

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 11
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值