MahoutInAction
文章平均质量分 68
我是一只小兔纸咿呀咿呀呦
To be a better me
展开
-
Windows下使用Cygwin模拟Linux环境安装配置过程
当年做毕设的时候没少折腾这个的说,安装过程好熟悉的感觉啊。。。http://blog.csdn.net/liu_jason/article/details/7705484在windows下通过安装cygwin模拟linux环境,然后再安装hadoop,是一种简单方便的方式。为hadoop准备的windows下cygwin环境安装过程如下:- 下载安装文件最新的cyg原创 2015-05-11 20:06:52 · 9257 阅读 · 0 评论 -
Mahout之推荐
http://blog.csdn.net/huhui_cs/article/details/85963883工程开发3.1推荐引擎简介推荐引擎利用特殊的信息过滤(IF,Information Filtering)技术,将不同的内容(例如电影、音乐、书籍、新闻、图片、网页等)推荐给可能感兴趣的用户。通常情况下,推荐引擎的实现是通过将用户的个人喜好与特定的参考特征进行比较,转载 2015-07-19 10:29:24 · 670 阅读 · 0 评论 -
FuzzyKmeans的Mahout实现
不得不说,google更靠谱,比google更更靠谱的是官网!!!so要好好利用google and official website!!!https://mahout.apache.org/users/clustering/fuzzy-k-means.htmlFuzzy K-MeansFuzzy K-Means (also called Fuzzy C-M转载 2015-07-14 16:57:20 · 1186 阅读 · 0 评论 -
ubuntu中安装jdk
http://blog.csdn.net/microfhu/article/details/7667393第一步:下载jdk-7-linux-i586.tar.gzwget -c http://download.oracle.com/otn-pub/java/jdk/7/jdk-7-linux-i586.tar.gz (注:如果下载不下来,建议使用迅雷下载,然转载 2015-07-13 14:52:32 · 457 阅读 · 0 评论 -
virtualbox中安装ubuntu
http://www.cnblogs.com/zhcncn/p/3987301.html网上教程有很多滴~但是有一个问题,安装第二个虚拟机的时候,偶尔黑屏,解决办法,多试几次吧O(∩_∩)O~原创 2015-07-13 14:58:36 · 333 阅读 · 0 评论 -
maven下log4j的配置
1、在pom.xml加入这些dependency; org.slf4j slf4j-api 1.6.6 org.slf4j slf4j-log4j12 1.6.6 log4j log4j 1.2.16然后会发现dependencies中多了以下几个:2、将log4j.properties放到src/m原创 2015-05-23 11:00:55 · 24524 阅读 · 0 评论 -
RecommenderIntro
1、RecommenderIntro.java 源代码:package com.zjuRabbit.rabbit.rabbit;import java.io.File;import java.io.IOException;import java.util.List;import org.apache.mahout.cf.taste.common.TasteException;im原创 2015-05-23 11:08:13 · 645 阅读 · 0 评论 -
mahout问题
如果你遇到了如下问题Could not find mahout-examples-*.job in /home/hadoop/mahout-distribution-0.9 or /home/hadoop/mahout-distribution-0.9/examples/target, please run 'mvn install' to create the .job file原创 2015-05-15 08:57:58 · 596 阅读 · 0 评论 -
分布式数据分析挖掘系统
1. 数据分析挖掘在信息时代,公司和个人的成功越来越依赖于迅速有效地将大量数据转化为可操作的信息。而信息时代的机器学习应用场景,如每天处理数以千计的个人电子邮件信息,从海量博客中推测用户的意图等,的输入数据通常都非常庞大,以至于无法在一台计算机上完全处理,即使这台计算机非常强大,如果没有快速并行处理的实现手段,这将是一项无法完成的任务,因此分布式数据分析挖掘系统逐渐成为了主流方向。目前的原创 2015-05-11 20:53:56 · 2102 阅读 · 0 评论 -
Windows下安装Hadoop
http://www.cnblogs.com/kinglau/archive/2013/08/20/3270160.html1、安装JDK1.6或更高版本 官网下载JDK,安装时注意,最好不要安装到带有空格的路径名下,例如:Programe Files,否则在配置Hadoop的配置文件时会找不到JDK(按相关说法,配置文件中的路径加引号即可解决,但我没测试成功)。2、原创 2015-05-11 20:46:34 · 432 阅读 · 0 评论 -
linux下安装maven
1、在https://maven.apache.org/download.cgi#下载apache-maven-3.3.3-bin.tar.gz2、tar zxvf apache-maven-3.3.3-bin.tar.gz,得到apache-maven-3.3.33、将maven复制到集群上的其他机器上:scp -r /home/udms/hadoop/apache-maven-3.3.原创 2015-07-21 16:31:15 · 402 阅读 · 0 评论