Mahout 初步：搭建测试样例

最新推荐文章于 2024-08-12 18:28:34 发布

d344498093

最新推荐文章于 2024-08-12 18:28:34 发布

阅读量307

点赞数

分类专栏：大三暑期实习（有关于Hadoop）文章标签：测试 hadoop java maven jdk 算法

本文链接：https://blog.csdn.net/d344498093/article/details/7822026

版权

大三暑期实习（有关于Hadoop）专栏收录该内容

8 篇文章 0 订阅

订阅专栏

一、安装配置
1、安装、配置JDK，Hadoop（略）
2、下载Mahout， http://mahout.apache.org/ ，非源码下载解压即可用（src为源码包，需要用maven编译）。
3、添加环境变量

修改/etc/profile ，添加

##根据实际情况修改

export JAVA_HOME=/usr/lib/jvm/java-1.6.0-openjdk

export HADOOP_HOME=/home/rongry/up实习/hadoop-1.0.2 export HADOOP_CONF_DIR=/home/rongry/up实习/hadoop-1.0.2/conf export MAHOUT_HOME=/home/rongry/up实习/mahout-distribution-0.6 ##export HADOOP_HOME_WARN_SUPPRESS=1

通过$MAHOUT_HOME/bin/mahout 命令检测是否安装成功。

二、运行示例
1、启动 Hadoop （hadoop namenode -format；start-all.sh）
2、下载测试输入数据
3、把数据导入HDFS中

$bin/hadoop fs mkdir testdata

$bin/hadoop fs -put synthetic_control.data testdata

4、运行示例
如：Kmeans聚类算法

$bin/hadoop jar $MAHOUT_HOME/mahout-examples-0.6-job.jar org.apache.mahout.clustering.
syntheticcontrol.kmeans.Job

他会启动多个job，输出output/大致如：
clusteredPoints/   clusters-2/        clusters-6/        data/
clusters-0/        clusters-3/        clusters-7/
clusters-1/        clusters-4/        clusters-8/
clusters-10-final/ clusters-5/        clusters-9/

d344498093

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Mahout 初步：搭建测试样例

一、安装配置1、安装、配置JDK，Hadoop（略）2、下载Mahout，http://mahout.apache.org/ ，非源码下载解压即可用（src为源码包，需要用maven编译）。3、添加环境变量修改/etc/profile ，添加##根据实际情况修改export JAVA_HOME=/usr/lib/jvm/java-1.6.0-openjdkexpo
复制链接

扫一扫