mahout
文章平均质量分 76
inte_sleeper
这个作者很懒,什么都没留下…
展开
-
mahout使用KMeans算法
mahout提供了内存中和分布式的两种KMeans聚类实现。下面是内存中KMeans的代码示例,示例代码使用了最简单的一维向量作为输入: /** * Tests KMeans cluster algorithm in memory, note the test uses only 1-D vector * i.e., a vector of a single do原创 2011-12-01 12:59:17 · 5271 阅读 · 0 评论 -
mahout分类算法效果评估指标
mahout中有许多分类器,包括Naive Bayes, Complementary Naive Bayes, Stochastic Gradient Descent, Support Vector Machine, Random Forest等。评估一个分类器(模型)的好坏,需要有一些指标,而在mahout中提供了下列衡量指标:1. %-correct (ConfusionMatrix原创 2012-03-20 15:09:15 · 2292 阅读 · 1 评论 -
mahout基于hadoop的CF代码分析
mahout的taste框架是协同过滤算法的实现。它支持DataModel,如文件、数据库、NoSQL存储等,也支持hadoop的MapReduce。这里主要分析的基于MR的实现。基于MR的CF实现主要流程就在org.apache.mahout.cf.taste.hadoop.item.RecommenderJob类中(注意mahout有两个RecommendJob,要看清楚是哪一个包)。这原创 2012-06-10 18:01:34 · 3721 阅读 · 1 评论