- 博客(5)
- 收藏
- 关注
原创 mahout推荐引擎使用hadoop(二) 计算协同矩阵
第二步,计算协同矩阵,主要在RowSimilarityJob 这个类中完成 ToolRunner.run(getConf(), new RowSimilarityJob(), new String[]{ "--input", new Path(prepPath, PreparePreferenceMatrixJob.RATING...
2013-02-28 16:14:58 188
原创 mahout推荐引擎使用hadoop
Taste 是 Apache Mahout 提供的一个协同过滤算法的高效实现,它是一个基于Java实现的可扩展的高效的推荐引擎。扩展性是指使用hadoop进行mapreduce计算,提高运算性能。 最近开始看源码,分析一下,做个笔记。 ItemSimilarityJob类是mahout使用hadoop做推荐引擎的主要实现类,下面开始分析。 run()函数是启动...
2013-02-28 15:22:06 115
原创 mahout推荐引擎使用hadoop(一) 生成偏好矩阵
第一个步骤就是生成偏好矩阵,这个工作是在PreparePreferenceMatrixJob中完成的。 下面具体的分析一下这个类。 if (shouldRunNextPhase(parsedArgs, currentPhase)) { ToolRunner.run(getConf(), new PreparePreferenceMatrixJob(), new ...
2013-02-27 14:06:16 331
原创 mahout实现的自然语言算法
Apache Mahout 是 ApacheSoftware Foundation (ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序,并且,在 Mahout 的最近版本中还加入了对Apache Hadoop 的支持,使这些算法可以更高效的运行在云计算环境中。 在Mahout实现的机器学习算法见下表: 算法类 ...
2013-02-25 15:36:14 92
原创 hadoop中使用MapReduce编程实例(转)
原文链接:http://www.cnblogs.com/xia520pi/archive/2012/06/04/2534533.html 从网上搜到的一篇hadoop的编程实例,对于初学者真是帮助太大了,看过以后对MapReduce编程基本有了大概的了解。看了以后受益匪浅啊,赶紧保存起来。 1、数据去重 "数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选...
2013-02-18 17:14:44 1500
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人