mahout
xiao_jun_0820
要自己每天都开心,不要烦恼
忘掉压力,天天好心情
展开
-
mahout入门之编写第一个基于用户的推荐程序
首先创建一个java工程,导入必要的jar包,工程结构类似下图:intro.txt测试数据如下:1,101,5.01,102,3.01,103,2.52,101,2.02,102,2.52,103,5.02,104,2.03,101,2.53,104,4.03,105,4.53,107,5.04,101,5.04,103,3.原创 2014-12-23 16:04:58 · 2455 阅读 · 1 评论 -
mahout入门之初次使用mahout
由于我是用parcels安装的hadoop集群,对应的example jar包在/opt/cloudera/parcels/CDH/lib/mahout/mahout-examples-0.8-cdh5.0.0-job.jar。a .下载测试数据:wget http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_c原创 2014-12-23 14:10:14 · 2586 阅读 · 0 评论 -
mahout入门之对推荐结果进行评估
package com.besttone.mahout.demo.recommender;import java.io.File;import java.io.IOException;import org.apache.mahout.cf.taste.common.TasteException;import org.apache.mahout.cf.taste.eval.Recomme原创 2014-12-23 23:41:34 · 2802 阅读 · 0 评论 -
mahout推荐入门之评估GroupLens数据集
前面都是在一个非常小的测试数据集上进行推荐评估,现在我们下载一个真实的数据集来进行评估。在http://www.grouplens.org/node/73上找到并下载ml-100k.zip,解压在其中找到ua.base文件作为我们的评估数据集。这是一个制表符分隔的文件,对于FileDataModel同样适合装载,包括我们前面用到的逗号分隔符的文件也可以。这个数据集中有100000个偏好值,相对原创 2014-12-24 12:53:24 · 3170 阅读 · 0 评论 -
mahout数据承载之FileDataModel的一个小插曲
FileDataModel在官方说是除了装载csv,tsv文件外,还可以装载压缩文件例如zip或gzip的,mahout in action书中也是那样说的。于是我抱着学习的态度去试验了一把,结果是出人意料的报错了:Exception in thread "main" java.util.NoSuchElementException at com.google.common.coll原创 2014-12-25 11:11:11 · 3335 阅读 · 0 评论 -
mahout推荐之关于动态刷新推荐引擎
我们知道FileDataModel可以装载一个偏好值文件,其实FileDataModel还支持动态更新装在的数据,增量更新文件命名规则如下:假如主数据文件为:intro.txt ,则增量更新文件的命名应为intro.1.txt ,intro.2.txt如此跟进。当调用refresh()方法时,会自动装在更新文件并更新现有偏好值数据。但是一般不会单独刷新DataModel组件,一般都是连原创 2015-01-05 21:22:19 · 1965 阅读 · 1 评论 -
mahout math中相关matrix和vector的用法DEMO
创建一个2x3稀疏矩阵: Matrix x = new SparseRowMatrix(2, 3, false); x.set("newsId1","c0", 0,0, 1.0); x.set("newsId2","c1", 1,1, 1.0); System.out.println(x); System.out原创 2015-12-29 18:54:57 · 902 阅读 · 0 评论