mahout in action
ericxk
这个作者很懒,什么都没留下…
展开
-
Mahout in Action 读书笔记chapter3 推荐数据的表示
这一章主要讲解的是 在Mahout里面表示和访问推荐程序的相关数据时所用的关键类。 Mahout中用于访问数据的关键抽象:DataModel。 当用户和物品的数据没有评分和偏好值时,也就是布尔偏好,这个时候需要做的处理。 1.偏好数据表示 1.1Preference对象 一个Prefernence对象表示一个用户对一个物品的偏好,是(用户ID,物品ID,偏好值)的抽象。最有可能原创 2014-07-11 00:56:58 · 747 阅读 · 0 评论 -
Mahout in Action 读书笔记chapter2 推荐系统
1.推荐定义 基于用户(user-based):要找到你可能喜欢的物品,你可以观察与你志趣相投的人喜欢什么。 基于物品(item-based):通过观察其他人的明显偏好,你可以弄清楚哪些东西和你已然喜欢的物品相似。 基于内容(content-based):立足于物品的属性来推荐,但是很难规整为一个框架。 Mahout对于基于内容的推荐较少。前两者是协同过滤的返利,也就是仅仅通过了原创 2014-07-08 21:39:06 · 731 阅读 · 0 评论 -
Mac os10.9.4下安装Hadoop2.4.0,Mahout的惨痛血泪史
一定要大概浏览完,有个整体的布局才行!写这篇文章花了2天,犯了很多错误,比如hadoop版本,比如配置信息,下次一定要注意,留个完整记录。 1.java 安装java,去官网上下载,这个没什么好说的。 2.Maven 2.1安装Maven 先从http://maven.apache.org/download.cgi ,下载Maven 3.2.2 (Binary tar.gz),然后解压,原创 2014-07-09 09:41:32 · 2863 阅读 · 0 评论 -
Mahout in Action 读书笔记chapter4 进行推荐
这一章主要介绍: 1.深入介绍item-based和user-based。 2.介绍这两种算法背后的相似性度量。 3.在Mahout中实现其他推荐算法,slope-one,基于SVD和基于聚类的算法。 1.理解探索基于用户推荐 1.1算法过程 for(用户u尚未表达的偏好)每个物品i for(对i有偏好的)每个其他用户v 计算u和v之间的相似度s 按原创 2014-07-11 22:08:40 · 1204 阅读 · 0 评论 -
hadoop的版本演变以及其他
以下资料均收集自网上,链接在最下方。 1.先贴个Hadoop官方说明 先贴出Apache Hadoop官方版本说明(至今2014-07-07): 1.2.X - current stable version, 1.2 release 2.4.X - current stable 2.x version 0.23.X - similar to 2.X.X but missing NN原创 2014-07-09 10:27:56 · 1002 阅读 · 0 评论 -
Mahout in Action 读书笔记chapter5 让推荐程序实用化
到了这一章就是真刀实枪的开始了。这是一个约会网站,首先需要下载 http://www.occamslab.com/petricek/data/libimseti-complete.zip : 这个里面包含了用户对其他人档案的评分,针对评分那个文件,事先经历了数据的预处理:提出了生成评分个数不到20个的用户,还排除了几乎对每个档案都给出相同分值的用户,因为这有可能是垃圾信息和不严肃的评分。还原创 2014-08-01 16:18:26 · 1153 阅读 · 0 评论