mahout源码目录结构(二)

转载 2016年05月31日 12:59:17
1.mahout的源码实现了两部分:
(1)mahout核心源码
(2)mahout定制Collections集合工具
2.Mahout源码目录说明
mahout-core:核心程序模块,位于/core目录下
mahout-math:核心程序使用的一些数据通用计算模块,位于/math目录下
mahout-utils:在核心程序中使用的一些通用的工具性模块,位于/utils目录下
3.mahout-collections
实现了核心程序中使用的集合类操作,该模块独立于mahout进行开发,是对标准jdk关于集合类的修改,使其适应数据密集型项目的开发。
(一)mahout core源码目录结构

  1. src/main/java  
  2. org.apache.mahout  
  3.     --cf.taste  
  4.         --common  
  5.         --eval  
  6.         --hadoop  
  7.             --als  
  8.             --item  
  9.             --preparation  
  10.             --similarity.item  
  11.         --impl  
  12.             --common  
  13.                 --jdbc  
  14.             --eval  
  15.             --model  
  16.                 --file  
  17.             --neighborhood  
  18.             --recommender  
  19.                 --svd  
  20.             --similarity  
  21.                 --file  
  22.                 --precompute  
  23.         --model  
  24.         --neighborhood  
  25.         --recommender  
  26.         --similarity  
  27.             --precompute  
  28.     --classifier  
  29.         --df  
  30.             --builder  
  31.             --data  
  32.                 --conditions  
  33.             --mapreduce  
  34.                 --inmem  
  35.                 --partial  
  36.             --node  
  37.             --ref  
  38.             --split  
  39.             --tools  
  40.         --evaluation  
  41.         --mlp  
  42.         --naivebayes  
  43.             --test  
  44.             --training  
  45.         --sequencelearning.hmm  
  46.         --sgd  
  47.     --clustering  
  48.         --canopy  
  49.         --classify  
  50.         --fuzzykmeans  
  51.         --iterator  
  52.         --kernel  
  53.         --kmeans  
  54.         --lda.cvb  
  55.         --spectral  
  56.             --kmeans  
  57.         --streaming  
  58.             --cluster  
  59.             --mapreduce  
  60.         --topdown  
  61.             --postprocessor  
  62.     --common  
  63.         --commandline  
  64.         --distance  
  65.         --iterator  
  66.             --sequencefile  
  67.         --lucene  
  68.         --mapreduce  
  69.         --nlp  
  70.         --parameters  
  71.     --driver  
  72.     --ep  
  73.     --fpm.pfpgrowth  
  74.         --convertors  
  75.             --integer  
  76.             --string  
  77.         --fpgrowth  
  78.         --fpgrowth2  
  79.     --math  
  80.         --hadoop  
  81.             --decomposer  
  82.             --similarity  
  83.                 --cooccurrence  
  84.             --solver  
  85.             --stats  
  86.             --stochasticsvd  
  87.                 --qr  
  88.         --neighborhood  
  89.         --random  
  90.         --ssvd  
  91.         --stats  
  92.     --vectorizer  
  93.         --collocations.llr  
  94.         --common  
  95.         --document  
  96.         --encoders  
  97.         --pruner  
  98.         --term  
  99.         --tfidf  
(二)mahout Collections集合类
  1. src/main/java  
  2.     --collections  
  3.     --math  
  4.         --bitvector  
  5.         --buffer  
  6.         --function      
  7.         --list  
  8.             --adapter  
  9.         --map  
  10.         --set 

mahout源码目录结构(二)

1.mahout的源码实现了两部分: (1)mahout核心源码 (2)mahout定制Collections集合工具 2.Mahout源码目录说明 mahout-core:核心程序模块,位于/cor...
  • zhouhong1026
  • zhouhong1026
  • 2014年02月26日 17:08
  • 2037

eclipse中mahout源码的导入及编译

1、将mahout源码导入到eclipse中:        1)解压mahout源码压缩文件,目录时:E:\EProject\mahout-distribution-0.5 2)把源码导入ecl...
  • arrow8071
  • arrow8071
  • 2016年05月27日 11:05
  • 782

mahout下的K-Means聚类实现与源码分析

一、概念介绍       K-means算法是硬聚类算法,是典型的局域原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-...
  • BBSETS
  • BBSETS
  • 2014年06月17日 16:39
  • 970

Mahout系列之推荐引擎核心源码

Mahout里面的推荐包括了常见的方法和多种扩充的方法,对推荐的模型做了很好的封装。下面我们就来一起读读源码,读读更健康! 下载Mahout,本文用到的是apache-mahout-distribut...
  • hugolyl
  • hugolyl
  • 2016年02月06日 11:07
  • 874

mahout-example中kmeans详解(1)宏观上了解kmeans源码

作为熟悉mahout中算法的第一步,
  • u014617685
  • u014617685
  • 2014年04月10日 10:41
  • 1174

Mahout贝叶斯算法源码分析(1)

继前篇mahout 中Twenty Newsgroups Classification运行实例,本篇主要分析该算法的各个任务,首先是第一个任务,即seqdirectory,在提示信息里面的内容如下: ...
  • fansy1990
  • fansy1990
  • 2013年08月28日 00:15
  • 3835

Mahout随机森林算法源码分析(3)--TestForest

Mahout版本:0.7,hadoop版本:1.0.4,jdk:1.7.0_25 64bit。 首先贴上调用TestForest的代码(win7下面myeclipse调用TestForest,这里要设...
  • fansy1990
  • fansy1990
  • 2013年09月25日 00:47
  • 5545

Mahout线性回归算法源码分析(1)--实战

版本:mahout0.9Mahout里面使用逻辑回归(logistic regression)的主要两个类是org.apache.mahout.classifier.sgd.TrainLogistic...
  • fansy1990
  • fansy1990
  • 2014年04月15日 16:24
  • 5308

mahout bayes源码分析总结

最近在学习mahout,首先从最简单的bayes分类入手研究了一下源码,有谬误之处欢迎批评指正。 一、贝叶斯分类 条件概率P(A|B) 表示事件B已经发生的前提下,事件A发...
  • HEYUTAO007
  • HEYUTAO007
  • 2014年08月06日 22:25
  • 3789

mahout之推荐系统源码笔记(4) ---总结与优化

mahout之推荐系统源码笔记(4) —总结花了三天的时间阅读分析了mahout推荐系统中基于java单机和基于hadoop的分布式mapreduce源码。根据其推荐系统hadoop程序的job划分写...
  • Utopia_1919
  • Utopia_1919
  • 2016年07月08日 13:50
  • 2397
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:mahout源码目录结构(二)
举报原因:
原因补充:

(最多只允许输入30个字)