为了能彻底的学懂《mahout实战》这本书,实验必不可少。但做为零基础的人,首先要解决的就是开发环境的问题,有了好的实验环境,对书中所提的例子,运用起来才会得手应手。逍遥选择的是Windows+Eclipse+Maven+Mahout单机环境。这篇文章将记录逍遥是如何搭建环境,便于和正常学习Mahout的朋友交流,也便于自己日后复习。
一、安装Eclipse
Eclipse的下载地址为:http://www.eclipse.org/downloads/,选择标准版就行。我选择的是“Eclipse IDE for Java EE Developers”版本。(至于各个版本有什么区别,逍遥还不是很懂)
安装完后运行Eclipse,为后续的安装做好准备。
Version: Luna Service Release 2 (4.4.2)
Build id: 20150219-0600
二、安装Maven插件
因为下载的版本是目前发布的最新版本,已经集成了m2eclipse插件,也就自动附带了Maven插件了。可以在help-->about Eclipse-->Installation Details中找到相关信息,也可以从new -->project-->maven选项中得到验证
三、安装mahout
mahout下载地址为:http://mahout.apache.org/
下载的版本为:mahout-distribution-0.9
解压到特定的文件夹中,如:F:\mahout-distribution
四、使用Maven构建Mahout项目
l 通过菜单File > New > Project新建项目,选择MavenProject
l 直接Next
l 选择maven-archetype-quickstart
l 输入GroupId和ArtifactId,可以根据自己喜好随便命名:如test
l 点了Finish后,Eclipse便会创建如下一个工程:
五、导入mahout文件
l 选中test项目-->右击-->properties-->Java Build Path--->Libraries菜单项
l 选择Add External JARS按钮--> 从第三步解压目录中选择特定文件:mahout-core-0.9.jar、mahout-core-0.9-job.jar、mahout-integration-0.9.jar、mahout-math-0.9.jar
l 导入后的目录结果如下
六、修改代码
修改com.mine.mahout.test包中的APP.JAVA文件Main函数中的内容
package com.mine.mahout.test;
import java.io.File;
import java.util.List;
import org.apache.mahout.cf.taste.impl.model.file.FileDataModel;
import org.apache.mahout.cf.taste.impl.neighborhood.NearestNUserNeighborhood;
import org.apache.mahout.cf.taste.impl.recommender.GenericUserBasedRecommender;
import org.apache.mahout.cf.taste.impl.similarity.PearsonCorrelationSimilarity;
import org.apache.mahout.cf.taste.model.DataModel;
import org.apache.mahout.cf.taste.neighborhood.UserNeighborhood;
import org.apache.mahout.cf.taste.recommender.RecommendedItem;
import org.apache.mahout.cf.taste.recommender.Recommender;
import org.apache.mahout.cf.taste.similarity.UserSimilarity;
public class App {
public static void main(String[] args) {
try {
// 从文件加载数据
DataModel model = new FileDataModel(new File("e:\\data.csv"));
// 指定用户相似度计算方法,这里采用皮尔森相关度
UserSimilarity similarity = new PearsonCorrelationSimilarity(model);
// 指定用户邻居数量,这里为2
UserNeighborhood neighborhood = new NearestNUserNeighborhood(2,
similarity, model);
// 构建基于用户的推荐系统
Recommender recommender = new GenericUserBasedRecommender(model,
neighborhood, similarity);
// 得到指定用户的推荐结果,这里是得到用户1的两个推荐
List<RecommendedItem> recommendations = recommender.recommend(1, 2);
// 打印推荐结果
for (RecommendedItem recommendation : recommendations) {
System.out.println(recommendation);
}
} catch (Exception e) {
System.out.println(e);
}
}
}
七、运行程序
选择程序运行Run As -->JavaApplication
结果如下
以上就是案例的整个过程,希望能帮助到正常学习Mahout的朋友,请大家注意,运行结果中有红色的信息,这是什么原因呢?等逍遥解决后,会在下一篇给出答案,同时欢迎大家评论,提出不足,便于提高,邮箱:cdazcl@163.com欢迎您的来信。讨论群:242848749
附录:
本文参考:http://www.cnblogs.com/freefalcon/p/3893590.html?utm_source=tuicool
测试文件:data.csv放到E盘中,内容如下
1,101,5
1,102,3
1,103,2.5
2,101,2
2,102,2.5
2,103,5
2,104,2
3,101,2.5
3,104,4
3,105,4.5
3,107,5
4,101,5
4,103,3
4,104,4.5
4,106,4
5,101,4
5,102,3
5,103,2
5,104,4
5,105,3.5
5,106,4