Mapr 安装hadoop的组件(六)——安装Mahout

阿帕奇亨利马乌™是一个可扩展的机器学习库。有关亨利马乌更多信息,请参阅Apache的亨利马乌项目。

本页内容:

安装亨利马乌

当MAPR服务是最初安装在讨论亨利马乌可以安装安装MAPR服务。如果初始MAPR服务安装过程中没有安装亨利马乌,亨利马乌可以在日后通过执行本节中的说明进行安装。这些程序可以在一个节点上的MAPR集群进行(见安装指南)或客户端(请参阅设置客户)。

下面的亨利马乌安装程序使用操作系统的软件包管理器,从MAPR存储库下载并安装亨利马乌。如果你想从包文件手动安装此组件,请参阅包和依赖关系为MAPR软件

在MAPR节点上安装亨利马乌

亨利马乌仅需要从其中亨利马乌应用程序将被执行的集群中的节点上安装。所以,你可能只需要一个节点上安装亨利马乌。但是,根据亨利马乌用户和预定亨利马乌作业数数,你可能需要一个以上的节点上安装亨利马乌。

亨利马乌应用程序可能运行MapReduce程序,默认情况下亨利马乌将使用群集的默认JobTracker的执行MapReduce作业。

运行Ubuntu一个MAPR节点上安装亨利马乌

运行Ubuntu作为MAPR节点上安装亨利马乌或使用sudo的通过执行以下的apt-get安装命令:

#apt-get的安装MAPR-象夫
运行Red Hat或CentOS的一个MAPR节点上安装亨利马乌

运行Red Hat或CentOS作为MAPR节点上安装亨利马乌或使用sudo的执行以下yum的安装命令:

#yum的安装MAPR-象夫

在客户端上安装亨利马乌

如果您在Linux客户机上安装亨利马乌,您可以从执行的MapReduce工作,你的客户端被配置为使用群集上运行的客户端应用程序亨利马乌。

提示:您不必为了从客户端运行亨利马乌应用程序在集群上安装亨利马乌。

运行Ubuntu客户端上安装亨利马乌

在客户机上运行的Ubuntu作为安装亨利马乌或使用sudo的通过执行以下的apt-get安装命令:

#apt-get的安装MAPR-象夫
在运行Red Hat或CentOS的客户端上安装亨利马乌

运行Red Hat或CentOS作为一个客户端上安装亨利马乌或使用sudo的执行以下yum的安装命令:

#yum的安装MAPR-象夫

配置环境亨利马乌

安装后,亨利马乌可执行文件位于以下目录:/ opt/mapr/mahout/mahout- <VERSION> /斌/象夫

例如:/ opt/mapr/mahout/mahout-0.7/bin/mahout


使用亨利马乌与MAPR,设置以下环境变量: 

  • MAHOUT_HOME -的路径亨利马乌目录。例如:$出口MAHOUT_HOME = / opt/mapr/mahout/mahout-0.7
     
  • JAVA_HOME -路径到Java目录。例如为Ubuntu:$出口JAVA_HOME = / usr/lib/jvm/java-6-sun
     
  • JAVA_HOME -路径到Java目录。例如红帽和CentOS:$出口JAVA_HOME = / usr/java/jdk1.6.0_24
      
  • HADOOP_HOME -路径到Hadoop的目录。例如:$出口HADOOP_HOME = / opt/mapr/hadoop/hadoop-0.20.2
     
  • HADOOP_CONF_DIR -从路径中,Hadoop配置参数的目录。例如:$出口HADOOP_CONF_DIR = / opt/mapr/hadoop/hadoop-0.20.2/conf

您可以通过将它们添加到坚持设置这些环境变量对所有用户的/ etc /环境文件作为或使用sudo的。文件中的环境变量的顺序并不重要。

例如条目在设置环境变量 在/ etc /环境 文件为Ubuntu:

      JAVA_HOME=/usr/lib/jvm/java-6-sun
      MAHOUT_HOME=/opt/mapr/mahout/mahout-0.7
      HADOOP_HOME=/opt/mapr/hadoop/hadoop-0.20.2
      HADOOP_CONF_DIR=/opt/mapr/hadoop/hadoop-0.20.2/conf

在设置环境变量的示例条目 在/ etc /环境 文件红帽和CentOS:

      JAVA_HOME=/usr/java/jdk1.6.0_24
      MAHOUT_HOME=/opt/mapr/mahout/mahout-0.7
      HADOOP_HOME=/opt/mapr/hadoop/hadoop-0.20.2
      HADOOP_CONF_DIR=/opt/mapr/hadoop/hadoop-0.20.2/conf

添加或编辑环境变量后的/ etc /环境文件中,你可以激活他们没有通过执行重新启动的命令:

$源的/ etc /环境

注:谁不有一个用户的根sudo的权限,可以将这些环境变量项,以他或她的〜/ bashrc中。文件。环境变量会在每次用户登录时设置

入门亨利马乌

要查看捆绑亨利马乌示例应用程序,执行以下命令:

$ $ ls的MAHOUT_HOME /例子/箱

要运行二十新闻组分类示例,执行以下命令:

$ CD $ MAHOUT_HOME
$ ./examples/bin/classify-20newsgroups.sh

从这个例子中,输出将类似于以下内容:



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值