![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Mahout
公子
这个作者很懒,什么都没留下…
展开
-
Mahout安装与测试-基于hadoop单结点伪分布式
安装JDK见我之前关于JDK1.7安装的博客:http://blog.csdn.net/stanely_hwang/article/details/18883599Hadoop单结点伪分布式安装见我之前关于Hadoop单结点伪分布式安装的博客:http://blog.csdn.net/stanely_hwang/article/det转载 2014-12-12 17:06:58 · 512 阅读 · 0 评论 -
Mahout相关笔记
1. Mahout是Hadoop的一种高级应用。运行Mahout需要提前安装好Hadoop,Mahout只在Hadoop集群的NameNode节点上安装一个即可,其他数据节点上不需要安装。(未完待续。。。)原创 2014-12-12 17:53:31 · 543 阅读 · 0 评论 -
SGD对20Newsgroups训练
1.环境准备:hadoop2.2.0集群(或伪集群),mahout0.9,有关hadoop2与mahout0.9冲突问题见其他文档。2. 下载20Newsgroups数据集放到hadoop主节点上,因为主节点配置了mahout3.具体代码如下:package mahout.SGD;import java.io.BufferedReader;import java.原创 2014-12-23 14:51:53 · 1069 阅读 · 0 评论 -
Mahout-RandomForests
1. 数据下载与准备1.1 下载地址为http://nsl.cs.unb.ca/NSL-KDD/1.2打开下载的数据,删除其中以@开头的数据 1.3 将数据上传到hdfs# $HADOOP_HOME/bin/hadoop fs -mkdir /testdata# $HADOOP_HOME/bin/hadoop fs -put /usr/local/mahout/data/原创 2015-01-20 15:45:32 · 1725 阅读 · 1 评论