关闭

hadoop 运行mahout 问题总结

完成Hadoop上的搭建,开始运行几个小的测试,毕竟第一次,遇到了一些小问题。 首先,是参考资料中的 验证安装是否成功的步骤。  将下载数据 synthetic_control.data 上传到HDFS中,命令如下   hadoop fs -mkdir   testdata(注意,此命令的文件夹路径必须是如上,不可是/testdata 等其他形式)   hadoop fs...
阅读(213) 评论(0)

hadoop平台下Mahout安装与配置

一、下载二进制文件 点击打开链接    二、解压文件 tar -zxvf mahout-distribution-0.9.tar.gz -C /usr 三、 配置环境变量:在/etc/profile, 添加MAHOUT_HOME 环境变量 export MAHOUT_HOME=/usr/apache-mahout-distribution-0.12.2 ...
阅读(288) 评论(0)

mahout之聚类实现

人们常数"物以类聚,人以群分",聚类就是将一个给定的文档集中相似项目分成不同簇的过程。        聚类设计的过程:        (1)一个聚类算法( k-means、模糊k-means、canopy等)        (2)相似性和不相似性的概念            a.欧式距离            b.平方欧式距离            c. 曼哈顿距离...
阅读(169) 评论(0)

推荐系统

推荐:通过对嗜好的模式进行预测,借以发现你尚未知晓,却合乎心意的新事物。         推荐引擎分类:(1)基于用户  (2)基于物品         具体的实现代码如下: package mia.recommender.ch02; import org.apache.mahout.cf.taste.common.TasteException; import org.apache.mah...
阅读(384) 评论(0)

初始Mahout

Mahout 在理论上可以实现所有的机器学习技术,但实际上当前它仅关注机器学习的三个领域,即推荐引擎(协同过滤)、聚类和分类。         安装Mahout:        (1) java 和IDE(eclipse、netbeans、intellij IDEA)        (2)安装Maven        (3)安装Mahout        (4)安装Hadoop    ...
阅读(420) 评论(0)
    个人资料
    • 访问:167958次
    • 积分:5216
    • 等级:
    • 排名:第5558名
    • 原创:219篇
    • 转载:175篇
    • 译文:118篇
    • 评论:34条
    个人博客
    最新评论