(一)UML知识:
在研究mahout源码时,需要用到UML来梳理清楚源码类之间的关系。
(二)参考资料目录
apache Mahout CookBook目录
1.
Mahout并没有如此的难
1.1Java和hadoop安装
1.2安装一个Maven和NetBeans开发环境
1.2安装一个Maven和NetBeans开发环境
1.3.编写一个基本的推荐引擎
2.什么时候,为什么要使用序列化文件?
2.1介绍
2.2通过命令行创建序列文件
2.3通过代码生成序列文件
2.4通过代码读序列文件
3.用外部数据源整合mahout
3.1介绍
3.2将外部数据源导入到HDFS
3.3将数据从HDFS导入的RDBMS
3.4创建一个Sqoop Job来处理RDBMS
3.5使用Sqoop API导入数据
4.Mahout中实现朴素贝叶斯分类
4.1介绍
4.2使用Mahout文本分类来验证
4.3通过代码来使用朴素贝叶斯分类
4.4通过代码来实现
互补的朴素贝叶斯分类
4.5编写
互补的朴素贝叶斯分类器
5.用Mahout来预测股市趋势
5.1介绍
5.2准备Logistic回归数据
5.3通过
Logistic回归数据预测GOOG走向
5.4在Java代码中使用合适的
Logistic回归数据
5.5使用随机森林来预测股票走向
6.Mahout中Canopy聚类
6.1介绍
6.2基于命令行的Canopy聚类
6.3基于命令行带参数的Canopy聚类
6.4Java实现Canopy聚类
6.5编写自己聚类距离评估算法
7.Mahout中谱聚类
7.1介绍
7.2通过命令行使用EigenCuts
7.3通过Java代码使用
EigenCuts
7.4通过原始数据来创建一个相似矩阵
7.5图像分割中使用谱聚类
8.K-means聚类
8.1介绍
8.2通过Java代码来使用K-means聚类
8.3使用K-means聚类交通事故
8.4通过命令行使用K-means聚类
9.用Mahout进行软件计算
9.1介绍
9.2用Mahout进行频繁项集挖掘
9.3为频繁项集挖掘创建度量
9.4通过Java代码使用频繁项集挖掘
9.5通过LDA创建主题
10.Mahout中实现遗传算法
10.1介绍
10.2为GA安装Mahout
10.3在图中使用遗传算法
10.4通过Java代码使用遗传算法
Mahout in action目录
第1章 初识Apache Mahout
1.1Mahout的故事
1.2Mahout的机器学习主题
1.3通过Mahouth和Hadoop来应对海量数据处理
1.41安装Mahout
1.5总结
第一部分:推荐
第2章
介绍推荐系统
第3章
推荐系统数据描述
第4章
做推荐
第5章
把推荐系统转换成产品
第6章
分布式推荐计算
第二部分:聚类
第7章
聚类介绍
第8章
数据描述
第9章
Mahout中的聚类算法
第10章
评估和改善聚类效果
第11章
将聚类转换成产品
第12章
聚类在真实世界的应用
第三部分:分类
第13章
分类介绍
第14章
分类器训练
第15章
分类器评估和调优
第16章
部署一个分类器
第17章
案例学习:为我购物
附录A:JVM调优
附录B:Mahout数学类
B.1 容器
B.2 Matrices
B.3 Mahout数学和Hadoop
只翻译了下两本mahout权威书籍的目录,这样方便自己有需要可以快速找到相关章节去仔细研究!