(一)Classification(分类算法)
完全支持:
1.Logistic Regression(Logistic回归)
2.Naive Bayes/ Complementary Naive Bayes(朴素贝叶斯/互补的朴素贝叶斯)
3.Random Forests(随机森林)
4.Hidden Markov Models(隐马尔可夫模型)
即将支持:
5.Online Passive Aggressive(在线被动攻击)
(二)Dimension reduction(聚类算法)
完全支持:
1.Canopy Clustering(Canopy聚类)
2.K-Means Clustering(K-Means聚类)
3.Fuzzy K-Means(模糊K-Means聚类)
4.Mean Shift Clustering(均值漂移聚类)
5.Dirichlet Process Clustering (狄利克雷过程聚类)
6.Latent Dirichlet Allocation(潜在狄利克雷分配)
7.Minhash Clustering(Minhash聚类)
8.kMeans++ streaming clustering(k均值+ +流媒体集群)
即将支持:
9.Hierarchical Clustering(层次聚类)
10.Spectral Clustering(谱聚类)
(三)Dimension reduction(降维)
完全支持
1.Singular Value Decomposition and other Dimension Reduction Techniques(奇异值分解和其他降维技术)
2.Stochastic Singular Value Decomposition with PCA workflow(随机奇异值分解与PCA工作流程)
即将支持:
3.Principal Components Analysis(主成分分析)
4.Gaussian Discriminative Analysis(高斯辨析)
(四)Evolutionary Algorithms(进化算法)
注:进化算法已经在mahout0.7版本中移除了。
(五)推荐引擎/协同过滤(Recommenders/Collaborative Filtering)
Mahout中包含了简单非分布式推荐引擎的实现和基于hadoop分布式推荐引擎的实现。
算法类 | 算法名 | 中文名 |
分类算法 | Logistic Regression | 逻辑回归 |
Bayesian | 贝叶斯 | |
SVM | 支持向量机 | |
Perceptron | 感知器算法 | |
Neural Network | 神经网络 | |
Random Forests | 随机森林 | |
Restricted Boltzmann Machines | 有限波尔兹曼机 | |
聚类算法 | Canopy Clustering | Canopy聚类 |
K-means Clustering | K均值算法 | |
Fuzzy K-means | 模糊K均值 | |
Expectation Maximization | EM聚类(期望最大化聚类) | |
Mean Shift Clustering | 均值漂移聚类 | |
Hierarchical Clustering | 层次聚类 | |
Dirichlet Process Clustering | 狄里克雷过程聚类 | |
Latent Dirichlet Allocation | LDA聚类 | |
Spectral Clustering | 谱聚类 | |
关联规则挖掘 | Parallel FP Growth Algorithm | 并行FP Growth算法 |
回归 | Locally Weighted Linear Regression | 局部加权线性回归 |
降维/维约简 | Singular Value Decomposition | 奇异值分解 |
Principal Components Analysis | 主成分分析 | |
Independent Component Analysis | 独立成分分析 | |
Gaussian Discriminative Analysis | 高斯判别分析 | |
进化算法 | 并行化了Watchmaker框架 | |
推荐/协同过滤 | Non-distributed recommenders | Taste(UserCF, ItemCF, SlopeOne) |
Distributed Recommenders | ItemCF | |
向量相似度计算 | RowSimilarityJob | 计算列间相似度 |
VectorDistanceJob | 计算向量间距离 | |
非Map-Reduce算法 | Hidden Markov Models | 隐马尔科夫模型 |
集合方法扩展 | Collections | 扩展了java的Collections类 |