获取 Mahout
下载最新 release 版本
在 这里 下载最新 release 版本。
另一个选择: 添加 Mahout 到maven 项目
Mahout 也可以在 maven repository 的 org.apache.mahout 组Id下找到. 如果你想在你的Java项目中引入最新release版本的Mahout, 请在你的 pom.xml 中加入如下依赖:
<dependency>
<groupId>org.apache.mahout</groupId>
<artifactId>mahout-core</artifactId>
<version>0.9</version>
</dependency>
使用Mahout
Mahout 准备了大量样例和指导, 以供用户快速学习如何使用机器学习算法.
Recommendations 推荐
点击 Recommender Quickstart 或者查看指南在 creating a userbased recommender in 5 minutes.
如果你是首次建立推荐系统, 参考 Dos and Don'ts 这个列表会对你有所帮助.
Clustering 聚类
点击 Synthetic data 样例.
Classification 分类
如果你对如何训练 朴素贝叶斯模型(Naive Bayes model)感兴趣, 请看 20 newsgroups 样例.
如果你要建立语音识别的 隐马尔科夫模型(Hidden Markov Model) , 这个样例 或有所帮助.
或者你可以参考 quick start page 建立 随机森林模型(Random Forest model).
文本处理
如果你需要转换原始文本到单词组, 并作为聚类或分类算法的输入, 请参考这个页面: how to create vectors from text.