Eclipse 下mahout的配置与使用

mahout 是一个开源的旨在为实际问题提供可伸缩性算法的软件。

官方主页:http://mahout.apache.org/

QuickStart:https://cwiki.apache.org/confluence/display/MAHOUT/Quickstart

 

目前的版本是0.4 ,此例展示了在eclipse下如何配置并应用mahout到你的程序中。

 

环境:eclipse +maven(m2eclipse)+ mahout 0.4 +jdk 1.6

 

配置:

 

Step 1: 

       在eclipse中新建一个maven程序 在”Select an Archetype“ 中选择”maven-Archetype-QuickStart“ 即可。

 

 

Step 2:

     打开pom.xml 加入一些必备的jar。 

点击 pom.xml 下的dependencies选项卡,在dependencies出点击add。 在弹出的对话框中输入”mahout“ 稍等片刻就会出来很多的jar包,选择合适的mahout包,一般来说,如果做的很简单的程序,选择mahout-core 就行,如果需要分布计算则需要加入 hadoop。

 

保存pom.xml 这是程序就会自动下载你所选择的jar包。

 

实例:

 

好了我们用一个例子来说明吧:

 

新建一个class 写入以下代码:

 

[java]  view plain
  1. import org.apache.mahout.cf.taste.impl.model.file.*;  
  2. import org.apache.mahout.cf.taste.impl.neighborhood.*;  
  3. import org.apache.mahout.cf.taste.impl.recommender.*;  
  4. import org.apache.mahout.cf.taste.impl.similarity.*;  
  5. import org.apache.mahout.cf.taste.model.*;  
  6. import org.apache.mahout.cf.taste.neighborhood.*;  
  7. import org.apache.mahout.cf.taste.recommender.*;  
  8. import org.apache.mahout.cf.taste.similarity.*;  
  9. import java.io.*;  
  10. import java.util.*;  
  11. public class RecommenderIntro {  
  12.     private RecommenderIntro(){};  
  13.       
  14.     public static void main (String args[])throws Exception{  
  15. //      step:1 构建模型 2 计算相似度 3 查找k紧邻 4 构造推荐引擎  
  16.         DataModel  model =new FileDataModel(new File("data/intro.csv"));  
  17.         UserSimilarity similarity =new PearsonCorrelationSimilarity(model);  
  18.         UserNeighborhood neighborhood =new NearestNUserNeighborhood(2,similarity,model);  
  19.         Recommender recommender= new GenericUserBasedRecommender(model,neighborhood,similarity);  
  20.         List<RecommendedItem> recommendations =recommender.recommend(12);  
  21.         for(RecommendedItem recommendation :recommendations){  
  22.             System.out.println(recommendation);  
  23.         }  
  24.           
  25.     }  
  26. }  
 

 

运行结果: 

 

 

RecommendedItem[item:104, value:4.257081]

RecommendedItem[item:106, value:4.0]

 

 

其中intro.csv 的格式如下:

[cpp]  view plain
  1. 第一列为UserID ,第二列为ItemID,第三列为Preference Value 即评分  
  2. 1,101,5  
  3. 1,102,3  
  4. 1,103,2.5  
  5. 2,101,2  
  6. 2,102,2.5  
  7. 2,103,5  
  8. 2,104,2  
  9. 3,101,2.5  
  10. 3,104,4  
  11. 3,105,4.5  
  12. 3,107,5  
  13. 4,101,5  
  14. 4,103,3  
  15. 4,104,4.5  
  16. 4,106,4  
  17. 5,101,4  
  18. 5,102,3  
  19. 5,103,2  
  20. 5,104,4  
  21. 5,105,3.5  
  22. 5,106,4  
 

 

 

Pom.xml 文件如下:

 

[xhtml]  view plain
  1. <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"  
  2.   xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">  
  3.   <modelVersion>4.0.0</modelVersion>  
  4.   <groupId>zhzhl_zju</groupId>  
  5.   <artifactId>mahout</artifactId>  
  6.   <version>0.0.1-SNAPSHOT</version>  
  7.   <packaging>jar</packaging>  
  8.   <name>mahout</name>  
  9.   <url>http://maven.apache.org</url>  
  10.   <properties>  
  11.     <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>  
  12.   </properties>  
  13.   <dependencies>  
  14.     <dependency>  
  15.       <groupId>junit</groupId>  
  16.       <artifactId>junit</artifactId>  
  17.       <version>3.8.1</version>  
  18.       <scope>test</scope>  
  19.     </dependency>  
  20.     <dependency>  
  21.         <groupId>org.apache.mahout</groupId>  
  22.         <artifactId>mahout-core</artifactId>  
  23.         <version>0.4</version>  
  24.         <type>jar</type>  
  25.         <scope>compile</scope>  
  26.     </dependency>  
  27.   </dependencies>  
  28. </project>  
 

原文地址:http://blog.csdn.net/zhzhl202/article/details/6316570

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值