Mahout学习之Mahout安装、配置、入门程序测试

最新推荐文章于 2024-10-11 23:11:04 发布

sunwhut333

最新推荐文章于 2024-10-11 23:11:04 发布

阅读量551

点赞数

分类专栏： hadoop 文章标签： mahout hadoop

hadoop 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

一、下载Mahout

http://archive.apache.org/dist/mahout/

二、解压

tar -zxvf mahout-distribution-0.9.tar.gz

三、配置Mahout环境变量

# set mahout environment

export MAHOUT_HOME=/usr/local/mahout-distribution-0.9

export MAHOUT_CONF_DIR=$MAHOUT_HOME/conf

export PATH=$MAHOUT_HOME/conf:$MAHOUT_HOME/bin:$PATH

四、验证Mahout是否安装成功

执行命令mahout。若列出一些算法，则成功，如图：

五、使用Mahout 之入门级使用

5.1、启动Hadoop，并创建相应的目录

5.2、下载测试数据

http://archive.ics.uci.edu/ml/databases/synthetic_control/链接中的synthetic_control.data

5.3、上传测试数据

hadoop fs -put synthetic_control.data /user/root/testdata

5.4 使用Mahout中的Canopy聚类算法，执行命令：

hadoop jar $MAHOUT_HOME/mahout-examples-0.7-job.jar org.apache.mahout.clustering.syntheticcontrol.canopy.Job

花费几分钟完成聚类。

5.5 查看聚类结果

执行命令：

mahout clusterdump -i output/clusters-0-final -p output/clusteredPoints -o /home/sun/t.txt

把聚类产生的序列文件转换为文本文件，打开文本文件之后可看到聚类的结果。

齐活，收工。Mahout继续学习中......

参考自：

Mahout学习之Mahout简介、安装、配置、入门程序测试

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

sunwhut333

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Hadoop入门进阶课程9--Mahout介绍、安装与应用案例

yirenboy的专栏

08-03

1064

1 搭建环境部署节点操作系统为CentOS，防火墙和SElinux禁用，创建了一个shiyanlou用户并在系统根目录下创建/app目录，用于存放Hadoop等组件运行包。因为该目录用于安装hadoop等组件程序，用户对shiyanlou必须赋予rwx权限（一般做法是root用户在根目录下创建/app目录，并修改该目录拥有者为shiyanlou(chown –R shiyanlou:shiya

Centos6.5 + Hadoop2.2.0 + Mahout安装(Maven & 发布版安装)

Zephyr's Blog

08-22

1982

Mahout 简介　　Mahout 是 Apache Software Foundation（ASF）旗下的一个开源项目，提供一些可扩展的机器学习领域经典算法的实现，旨在帮助开发人员更加方便快捷地创建智能应用程序。Apache Mahout项目已经发展到了它的第三个年头，目前已经有了三个公共发行版本。Mahout包含许多实现，包括聚类、分类、推荐过滤、频繁子项挖掘。此外，通过使用 Apache H

参与评论您还未登录，请先登录后发表或查看评论

Mahout安装与配置

weixin_33933118的博客

03-15

189

Mahout是Hadoop的一种高级应用。运行Mahout需要提前安装好Hadoop。Hadoop的安装网上很多，并不复杂，这里不再讲述，接下来阐述怎么安装Mahout。1：下载二进制解压安装。到http://labs.renren.com/apache-mirror/mahout/0.7下载，我选择下载二进制包，直接解压及可。 hadoop@ubuntu:~$ tar -zxvf maho...

Mahout 0.9在windows上安装运行

zzzzzqf的专栏

04-18

2676

Mahout 0.9在windows上安装需要：eclipse,jdk,maven,hadoop 详见：http://blog.fens.me/hadoop-mahout-maven-eclipse/ 1. 安装maven 下载最新版的maven：http://maven.apache.org/download.cgi 解压到E:\maven-3.2.1 将E:\maven-3.

mahout windows 安装及遇到问题

zhirom的专栏

10-16

1079

安装可以按照：http://www.tuicool.com/articles/rmiEz2 1、Missing artifact activation:activation:jar:1.0.2:

Centos7 + Hadoop3.1.0 + Mahout（Windows）环境搭建

weixin_42980089的博客

09-03

624

Centos7 + Hadoop3.1.0 + Mahout环境搭建一、创建虚拟机二、网络环境配置 1、虚拟网络编辑器设置（更改子网IP与网关） 2、静态ip配置 vim /etc/sysconfig/network-scripts/ifcfg-ens33 更改BOOTPROTO为static,新增IPADDR、GATEWAY、NETMASK（与虚拟网络编辑器中保持一致）192.16...

mahout0.9的安装和配置（1）

自天祐之，吉，无不利。

04-06

3289

Mahout是Hadoop的一种高级应用。运行Mahout需要提前安装好Hadoop。Hadoop的安装网上很多，并不复杂，这里不再讲述，接下来阐述怎么安装Mahout。本人使用的环境是windows7_64位操作系统、wmware 10、ubuntu 64位 14.0 、hadoop2.2.0、mahout 0.9,虚拟机内存1个G

结合mahout的数据挖掘算法介绍

热门推荐

行走的逗比

09-03

2万+

数据挖掘算法前言：数据挖掘和机器学习包含了许多的算法，算法的介绍往往是枯燥乏味的。本文中结合mahout和小例子还解释这些算法。因此我们先介绍一下mahout。准备工作：Mahout环境的搭建初识mahout Hadoop是为了大数据而生的，在之前的学习中，我们也了解了Mapreduce程序的基本原理。但是，读者对如何将Hadoop应用到大数据还是没有一个清晰地认识。相信读者朋友们了

大数据入门没有头绪？这份总结的大数据学习路线希望你用得着

qq_43958467的博客

08-22

622

1、为什么要学习大数据？ 1.1，门槛它比 Java 高一点，因为除了对数据库的操作之外，要学习大数据生态的东西，需要会分布式、数仓、中间件等知识。它比机器学习低一些，不需要你会很多的机器学习算法和数学知识，而像机器学习算法和数学知识是需要长时间的磨练和沉淀，所以做这块的研究生和博士居多。无论是哪个学校的计算机专业，Java、数据、C、C++什么的都会接触到，但是大数据呢？第一...

Java 学习路线大全，再也不用迷路啦（持续更新）

腾讯全栈-ITCJF

10-14

2820

mahout的安装及实验

ddjj131313的专栏

10-13

986

ref: http://www.cnblogs.com/duzl/archive/2012/05/18/2507470.html Apache Mahout 简介 http://www.ibm.com/developerworks/cn/java/j-mahout/ 一.安装mahout需要的软件： 1，jdk 1.6或以上，下载地址不提供了。 2，maven 软件项目管理工

Mahout实践：Mahout安装部署-9

奔腾游子

12-30

1747

Mahout实践：Mahout安装部署 1、实验描述本实验通过在Hadoop集群已经部署的前提下，安装配置Mahout，并使用默认的配置，使得mahout运行于集群模式之下。实验时长：45分钟主要步骤：打开hadoop集群安装配置Mahout 验证Mahout安装 2、实验环境虚拟机数量：3 系统版本：CentOS 7.5 Mahout版本：apache-mahout-distribution-0.13.0 Hadoop版本：Hadoop 2.7.

第一篇：win7下mahout搭建简单推荐系统

u014048459的专栏

09-18

1183

之前查了很多

mahout的安装、配置及运行java程序

weixin_30325487的博客

07-16

477

一、下载安装包： http://mahout.apache.org/general/downloads.html 二、解压：将下载的安装包解压到需要的目录下三、配置环境变量： export MAHOUT_HOME=/Users/iris/Downloads/apache-mahout-distribution-0.10.1 export MAHOUT_CONF_DIR=...

Mahout 安装配置及一个简单测试

weixin_33936401的博客

11-24

443

Mahout 简介 Mahout 是一个很强大的数据挖掘工具，是一个分布式机器学习算法的集合，包括：被称为Taste的分布式协同过滤的实现、分类、聚类等。Mahout最大的优点就是基于hadoop实现，把很多以前运行于单机上的算法，转化为了MapReduce模式，这样大大提升了算法可处理的数据量和处理性能。 Hadoop http...

IT毕设梦工厂的博客

10-08

1220

在数字化时代背景下，图书行业正经历着前所未有的变革。随着互联网的普及和数字阅读平台的兴起，图书的销售和阅读方式日益多样化，产生了海量的图书相关数据。这些数据包括图书销量、读者评价、图书类别、作者信息等，它们对于出版社、书店以及作者本人来说具有极高的价值。有效的数据分析能够帮助相关利益方更好地理解市场趋势，优化图书选题，制定营销策略，提升读者阅读体验。根据中国新闻出版研究院发布的数据，2023年中国图书零售市场码洋规模达到1500亿元，同比增长约10%，其中线上销售码洋规模占比超过70%。

IT毕设梦工厂的博客

10-08

1458

电影产业作为文化产业的重要组成部分，在世界各国的经济发展中扮演着越来越重要的角色。随着全球化的推进和数字技术的发展，中国电影市场近年来呈现出爆发式增长。据国家电影局发布的数据显示，2023年中国电影票房达到472.58亿元人民币，同比增长超过130%，银幕总数超过8万块，已经成为全球第二大电影市场。在这样一个庞大的市场中，电影票房数据作为衡量电影市场表现的重要指标，对于电影制作方、发行方、投资者以及政策制定者来说具有极高的参考价值。

linux安装hadoop