![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
mahout
文章平均质量分 82
eric509
这个作者很懒,什么都没留下…
展开
-
mahout推荐引擎使用hadoop(三) 协同矩阵与用户向量相乘
第三步,就是准备协同矩阵与用户向量相乘的过程了 //协同矩阵与用户向量相乘 //start the multiplication of the co-occurrence matrix by the user vectors if (shouldRunNextPhase(parsedArgs, currentPhase)) { //第一个MapR...原创 2013-03-01 17:35:58 · 200 阅读 · 0 评论 -
mahout推荐引擎使用hadoop
Taste 是 Apache Mahout 提供的一个协同过滤算法的高效实现,它是一个基于Java实现的可扩展的高效的推荐引擎。扩展性是指使用hadoop进行mapreduce计算,提高运算性能。 最近开始看源码,分析一下,做个笔记。 ItemSimilarityJob类是mahout使用hadoop做推荐引擎的主要实现类,下面开始分析。run()函数是启动...原创 2013-02-28 15:22:06 · 111 阅读 · 0 评论 -
mahout推荐引擎使用hadoop(一) 生成偏好矩阵
第一个步骤就是生成偏好矩阵,这个工作是在PreparePreferenceMatrixJob中完成的。下面具体的分析一下这个类。 if (shouldRunNextPhase(parsedArgs, currentPhase)) { ToolRunner.run(getConf(), new PreparePreferenceMatrixJob(), new ...原创 2013-02-27 14:06:16 · 325 阅读 · 0 评论 -
mahout实现的自然语言算法
Apache Mahout 是 ApacheSoftware Foundation (ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序,并且,在 Mahout 的最近版本中还加入了对Apache Hadoop 的支持,使这些算法可以更高效的运行在云计算环境中。在Mahout实现的机器学习算法见下表:算法类...原创 2013-02-25 15:36:14 · 87 阅读 · 0 评论 -
mahout的推荐引擎Taste的学习笔记(四)
三、Slope One协同过滤1、Slope One原理为了大大减少过适(过拟合)的发生,提升算法简化实现, Slope One 系列易实现的Item-based协同过滤算法被提了出来。本质上,该方法运用更简单形式的回归表达式() 和单一的自由参数,而不是一个项目评分和另一个项目评分间的线性回归 ()。 该自由参数只不过就是两个项目评分间的平均差值。甚至在某些实例当中,它比线性回归的方...原创 2013-01-31 16:19:25 · 238 阅读 · 0 评论 -
mahout的推荐引擎Taste的学习笔记(三)
(二) 基于物品的CF 了解了 User CF,Mahout Item CF 的实现与 User CF 类似,是基于 ItemSimilarity,下面我们看实现的代码例子,它比 User CF 更简单,因为 Item CF 中并不需要引入邻居的概念:清单 4. 基于 Mahout 实现 Item CF...原创 2013-01-30 17:07:44 · 254 阅读 · 0 评论 -
mahout的推荐引擎Taste的学习笔记(二)
(一)基于 Mahout 实现 User CF 1、相似度的计算Similarity是计算两个用户或者两个物品之间的相似度的,归结到数学上就是计算向量的距离。Mahout 中提供了基本的相似度的计算,它们都实现了UserSimilarity 这个接口,实现用户相似度的计算,包括下面这些常用的:PearsonCorrelationSimilarity:基于皮尔逊相关系数...原创 2013-01-30 14:39:55 · 227 阅读 · 0 评论 -
mahout的推荐引擎Taste的学习笔记(一)
mahout中的一个模块Taste实现了推荐引擎的功能,到网上查了一下资料,都没有任何Taste源码分析,只有自己看一看代码了,能记的就记录下来,以后用到的时候就方便了。推荐引擎的原理是协同过滤 (Collaborative Filtering, 简称 CF),下边就用这个缩写了。1、基于用户的CF基于用户的 CF 的基本思想相当简单,基于用户对物品的偏好找到相邻邻居用户,...原创 2013-01-30 10:14:12 · 414 阅读 · 0 评论 -
推荐引擎相关算法(转)
原帖:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/index.html备忘,转过来了 集体智慧和协同过滤什么是集体智慧集体智慧 (Collective Intelligence) 并不是 Web2.0 时代特有的,只是在 Web2.0 时代,大家在 Web 应用中利用集体智慧构建更...原创 2013-01-18 16:50:40 · 687 阅读 · 0 评论 -
mahout推荐引擎使用hadoop(二) 计算协同矩阵
第二步,计算协同矩阵,主要在RowSimilarityJob 这个类中完成 ToolRunner.run(getConf(), new RowSimilarityJob(), new String[]{ "--input", new Path(prepPath, PreparePreferenceMatrixJob.RATING...原创 2013-02-28 16:14:58 · 185 阅读 · 0 评论