简介
Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。
以上来自“百度百科”
搭建环境
- mac OSX EI Capitan 10.11.5 (master节点)
- 虚拟机:Parallels Desktop
- ubuntukylin 14.04 64bit * 2 (node1节点,node2节点)
- Hadoop 2.6.2
- Mahout 0.12.1
配置Hadoop环境
请参考博文:Hadoop完全分布式配置。
安装并配置Mahout环境
1. 下载安装包:点此选择想要下载的版本。有两种类型,一种是编译好的项目,另一种是源代码,需要自己在本地编译。我们采用的是已经编译好的版本(就是压缩包名没有“src”的那个)。
2. 在合适的目录解压缩&#x