Mahout
文章平均质量分 84
Gold_Spring
2-3的目标:程序员中的黑马!!!
展开
-
用Maven创建Mahout项目
Hadoop家族系列文章,主要介绍Hadoop家族产品,常用项目包括Hadoop,Pig,HBase,Sqoop,Mahout,Zookeeper,Avro,Ambari,Chukwa新增加的项目包括YARN,Hcatalog,Oozie,Cassandra,Hama,Whirr,Flume,Bigtop,Crunch,Hue等。 前言 基于Hadoop的项目,不管是MapReduce开发,还是原创 2015-04-11 00:11:14 · 661 阅读 · 0 评论 -
Mahout分布式程序开发 聚类Kmeans
前言 Mahout是基于Hadoop用于机器学习的程序开发框架,Mahout封装了3大类的机器学习算法,其中包括聚类算法。Kmeans是我们经常会提到的聚类算法之一,特别是处理未知数据集的时候,都会先聚类一下,看看数据集会有些什么样的规则。 本文主要讲解,基于Mahout程序开发,实现分布式的Kmeans算法。目录聚类算法KmeansMahout开发环境介绍用Mahout实现聚类算法Kme原创 2015-04-17 19:35:27 · 2103 阅读 · 0 评论 -
从源代码剖析Mahout推荐引擎
前言 Mahout框架中cf.taste包实现了推荐算法引擎,它提供了一套完整的推荐算法工具集;同时规范了数据结构,并标准化了程序开发过程。应用推荐算法时,代码也就7-8行,简单地有点像R了,为了使用简单的目标,Mahout推荐引擎必然要做到精巧地程序设计。 本文介绍了Mahout推荐引擎的程序设计。目录Mahout推荐引擎概况标准化的程序开发过程数据模型相似度算法工具集近邻算法工具集原创 2015-04-14 20:23:55 · 577 阅读 · 0 评论 -
Mahout分布式程序开发 基于物品的协同过滤ItemCF
前言 Mahout是Hadoop家族中一员,从血缘就继承了Hadoop程序的特点,支持HDFS访问和MapReduce分布式计算法。随着Mahout的发展,从0.7版本开始,Mahout做了重大的升级。移除了部分算法的单机内存计算,只支持基于Hadoop的MapReduce平行计算。目录mahout开发环境介绍Mahout基于Hadoop的分布式计算环境介绍用Mahout实现协同过滤Item原创 2015-04-14 20:50:30 · 1824 阅读 · 0 评论 -
Mahout推荐算法API详解
前言 用Mahout来构建推荐系统,是一件既简单又困难的事情。简单是因为Mahout完整地封装了“协同过滤”算法,并实现了并行化,提供非常简单的API接口;困难是我们不了解算法细节,很难根据业务的场景进行算法配置和调优。 本文将深入算法的API去解释Mahout推荐算法底层的一些事。目录Mahout推荐算法介绍算法评判标准:召回率与准确率Recommender.java的API接口测试程原创 2015-04-12 21:37:59 · 930 阅读 · 0 评论 -
R实现MapReduce的协同过滤算法
基于物品推荐的协同过滤算法介绍R本地程序实现R基于Hadoop分布式程序实现1.基于物品推荐的协同过滤算法介绍文字说明部分: 越来越多的互联网应用,都开始使用推荐算法(协同过滤算法)。根据用户活跃度和物品流行度,可以分为”基于用户的协同过滤算法”和”基于物品的协同过滤算法”。基于用户的协同过滤算法,是给用户推荐和他兴趣相似的其他用户喜欢的物品。基于物品的协同过滤算法,是给用户推荐和他之前原创 2015-04-12 20:26:46 · 796 阅读 · 0 评论 -
Mahout学习路线图
前言Mahout是Hadoop家族中与众不同的一个成员,是基于一个Hadoop的机器学习和数据挖掘的分布式计算框架。Mahout是一个跨学科产品,同时也是我认为Hadoop家族中,最有竞争力,最难掌握,最值得学习的一个项目之一。 Mahout为数据分析人员,解决了大数据的门槛;为算法工程师,提供基础的算法库;为Hadoop开发人员,提供了数据建模的标准;为运维人员,打通了和Hadoop连接。 M原创 2015-04-12 19:49:48 · 704 阅读 · 0 评论 -
用Maven构建Hadoop项目
前言 Hadoop的MapReduce环境是一个复杂的编程环境,所以我们要尽可能地简化构建MapReduce项目的过程。Maven是一个很不错的自动化项目构建工具,通过Maven来帮助我们从复杂的环境配置中解脱出来,从而标准化开发过程。所以,写MapReduce之前,让我们先花点时间把刀磨快! 目录Maven介绍Maven安装(win)Hadoop开发环境介绍用Maven构建Hadoop原创 2015-04-11 13:17:59 · 726 阅读 · 0 评论 -
用R解析Mahout用户推荐协同过滤算法(UserCF)
前言 用R全面解析Mahout的基于用户推荐协同过滤算法(UserCF),改进的采用欧式距离,并用R语言实现,与Mahout的结果进行对比。 Mahout是Hadoop家族用于机器学习的一个框架,包括三个部分,推荐,聚类,分类! 我在这里做的是推荐部分。推荐系统在现在的互联网应用中很常见,比如,亚马逊会推荐你买书,豆瓣会给你一个书评,影评。 目录Mahout的模型介绍R语言模型实现算法原创 2015-04-11 13:51:10 · 730 阅读 · 0 评论 -
使用Eclipse构建Maven项目
前言 Apache Maven,是一个软件(特别是Java软件)项目管理及自动构建工具,由Apache软件基金会所提供,基于项目对象模型(缩写:POM)概念,Maven利用一个中央信息片断能管理一个项目的构建、报告和文档等步骤。曾是Jakarta项目的子项目,现在为独立Apache项目。 Maven项目使用称为项目对象模型(Project object Model,POM)来配置的。项目对象模型原创 2015-04-17 21:34:28 · 909 阅读 · 0 评论