设置Kettle7.1接CDH hadoop集群

在开始之前,你需要做一些事情。


验证支持

检查组件引用,以验证您的Kettle7.1版本支持您的MAPR集群版本。


建立MAPR集群

Kettle7.1可以连接到安全的和不安全的MAPR集群。

配置MAPR集群。如果需要帮助,请参阅MapR的文档。

安装任何必需的服务和服务客户端工具。

测试群集。


设置MapR客户端


安装MapR客户机,然后进行测试,以确保它正确地安装在计算机上,并且能够连接到MapR集群并浏览该集群。有关如何做到这一点的更多信息,请访问MAPR站点。


将MPRALHOST环境变量设置为MAPR客户端的安装位置。

 

如果在Windows上安装MAPR 4.0.1,请使用版本4.0.1.31009GA或更高版本作为MAPR客户端。如果使用MAPR 4.1.0,则使用MAPR客户端的4.1.0.31、175GA版本。该软件可以从MAPR获得。


复习特定版本的注释部分

阅读特定版本的注释部分,查看您的MAPR版本的特殊配置说明。


如果您连接到一个安全的MAPR集群,还有一些额外的事情需要做。


用Kerberos保护MAPR集群

TunaHo支持Kerberos身份验证。你将需要:

在集群上配置Kerberos安全性,包括Kerberos域、Kerberos KDC和Kerberos管理服务器。

配置名称、数据、辅助名称、作业跟踪器和任务跟踪器节点以接受远程连接请求。

设置Kerberos名称、数据、辅助名称,工作跟踪,和任务跟踪节点如果你已经部署了Hadoop的使用企业级程序。

将每个应该访问Hadoop集群的PudiaHo用户的用户帐户凭据添加到Kerberos数据库中。确保每个用户的Hadoop集群要添加到Kerberos数据库在每个节点上的操作系统的用户帐户。如有必要,添加操作系统用户帐户。请注意,用户帐户UID必须大于最小用户ID值(M.U.S.ID)。通常,最小用户ID值设置为1000。


在你的五音计算机上设置Kerberos

如何在您的PATHAO计算机上设置Kerberos出现了这样的指令。


设置模拟


如果您将使用模拟,您还需要完成MAPR模拟文章中的步骤。


如果你计划使用欺骗或伪装与MAPR客户,指定适当的用户标识(UID),组ID(GID),和名称在MAPR文档说明。(注意:确保您用于欺骗的帐户是由客户端和每个节点创建的。每个“欺骗”帐户应该具有与客户端相同的UID和GID。


在群集上不需要对*-Test.xml配置文件进行编辑。

配置五边形组件垫片


必须为要连接到MAPR集群的下列每个配置配置垫片:

    Spoon (PDI Client)
    Pentaho Server
    Pentaho Report Designer (PRD)
    Pentaho Metadata Editor (PME)


作为最佳实践,首先在调羹中配置垫片。Spoon 具有帮助您测试配置的功能。然后将测试的Spoon 配置文件复制到其他组件,必要时进行更改。


您还可以选择通过每个Pentaho 组件的这些指令,而不是从Spoon 复制垫片文件。如果不打算从Spoon 连接到群集,则可以先在另一个组件中配置垫片。


如果不打算从Spoon 连接到群集,则可以先将连接配置为另一个组件。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值