推荐系统
caizhongda
这个作者很懒,什么都没留下…
展开
-
1. Mahout 若只如初见
1. Mahout 若只如初见本章组要内容有: * Mahout 是什么,她从哪里来 * 真实世界中的 推荐引擎、聚集、分类 的花容月貌 * 安顿好我们的大象夫 Mahout原创 2011-10-18 20:28:34 · 557 阅读 · 0 评论 -
3 推荐数据的呈现
这章主要讲述: 。Mahout如何展现推荐器的数据。DataModel 的实现及其用法 。没有评分数据 Recommendations的质量主要是由数据的数量和质量决定的。“无用输出,无用输入” 在这里是最真实的。同样,推荐器算法都是集中数据,运行的性能主要受数据的数量和展现的影响。这一章介绍Mahout的一些关键class,和访问推荐器相关的数据。3.1原创 2012-01-11 16:01:50 · 1103 阅读 · 0 评论 -
2.3 推荐器的评估
差值的平均值这是一个推荐引擎的工作,用来解释下面的问题:“对用户来说,怎么的推荐数据才是最好的”。在搞清楚这个的答案之前,我们首先应该解决这个问题。一个好的推荐数据精度指的是什么?我们需要知道产出一个怎么样的推荐器来产生他们?本节的下面部分将会探讨对一个推荐器的考核。因为它是一个工具,当我们开始思考特殊的推荐系统时,它将会是很有用的。最优秀的推荐器,能够感知你的心灵。它以某种方式知道你可能原创 2011-12-23 14:34:14 · 1312 阅读 · 1 评论 -
2.6 推荐器介绍-小结
在这章里,我们介绍了推荐引擎的概念。通过一个少量输入,创建一个简单的Mahout recommender,通过一个简单的计算来运行并解释了这个结果。原创 2011-12-23 14:54:32 · 723 阅读 · 0 评论 -
2.5 评估 GroupLens数据集
用这些在进行中的工具,我们将可能不仅讨论速度,也讨论我们创造和修改的推荐引擎的质量。虽然大量真实数据的例子仍然要过几章才能讲到,我们将花一些时间在一个小型数据集合上去快速评估性能。2.5.1 提取推荐器输入数据 GroupLens (http://grouplens.org/)是一个研究项目,它提供几个不同型号的数据集合,每一个都来自于真实的用户对电影的评分。这是几个有效的大型原创 2011-12-23 14:52:32 · 3322 阅读 · 0 评论 -
2.4 推荐器评估的精度和调用
我们也可以得到一个关于recommender问题的更宽广的看法:对生产recommendations我们不用必须估计首选项值。没必要总是对用户提供估计的首选项值。在很多情况下,我们所想要的是一个recommendations的从最好到最差的排序列表。事实上,在有些情况下,我们不是很关心列表的精确排序:一组有点好的recommendations是好的。用更一般的看法,我们也可以把经典原创 2011-12-23 14:45:54 · 1321 阅读 · 0 评论 -
2.2 运行第一个推荐引擎
Mahout包含一个推荐引擎的几种类型,事实上包含传统的基于用户(user-based),基于项目(item-based)推荐算法,也包括基于“slope-one”技术的实现(这一个新的有效的方法)。你将根据实验,基于单机版的(SVD)初步实现。在下面的章节里,我们将会在Mahout的背景下和一些现实生活中的例子,来回顾上面的观察结果。我们将会考虑如何代表数据,如何进行有效的推荐算法,原创 2011-10-19 19:09:27 · 1088 阅读 · 0 评论 -
2 推荐器
2 推荐器 本章的主要内容:* 在Mahout中推荐器Recommender是什么样的* 运行第一个推荐器Recommender* 评估推荐引擎的准确和质量* 用GroupLens网站的真实的数据来评估推荐器每天我们都会有对周围的东西有一些看法和观点,这些东西可能是我们喜欢的,不喜欢的,还有莫不关心的东西 ,这些通常发生在不知不觉中。原创 2011-10-18 21:21:41 · 686 阅读 · 0 评论 -
Mahout in action 目录
1. 初识Mahout对应英文版:1. Meet Apache Mahout Part 1 Recommendations2. Introducing recommenders3. Representing da原创 2011-10-18 20:22:26 · 649 阅读 · 0 评论 -
1.3 驾驭Mahout和Hadoop,处理数据
1.3 驾驭Mahout和Hadoop,处理数据1.4 Mahout的安装原创 2011-10-18 21:06:33 · 762 阅读 · 0 评论 -
3.2 内存中的DataModel
3.2 内存中的DataModel这是个抽象概念,在Mahout中,recommender的输入数据是DataModel。DataModel的实现为各种推荐器算法需要的数据提供了有效的使用。例如,一个DataModel可以在输入数据中,提供一个包括所有user IDs的列表,或提供与一个item相关联的所有分值,或者提供一个为一系列item IDs打分的所有用户的列表。我们将会集中研究一些hi原创 2012-01-11 18:13:17 · 945 阅读 · 0 评论