1. Mahout0.9 ——hadoop2.2.0编译与安装
1.1. 基础准备
1) JDK安装2) Maven安装
见《基础准备(Hadoop/Spark/Mahout安装准备)》。
1.2. 下载Mahout源码
Mahout官方下载地址:http://archive.apache.org/dist/mahout/
可以直接下载官方已经编译好的包,mahout-distribution-0.9.zip ,但是编译好的包只支持hadoop1 分布式计算。如果需要支持hadoop2.X系列需要下载源码重新编译。mahout-distribution-0.9-src.tar.gz 的下载地址:
http://archive.apache.org/dist/mahout/0.9/mahout-distribution-0.9-src.tar.gz
1.3. Mahout0.9编译
1) Mahout0.9源码修改(Mahout源码打patch)
目前mahout只支持hadoop1 的缘故。在这里可以找到解决方法:https://issues.apache.org/jira/browse/MAHOUT-1329。主要就是修改pom文件,修改mahout的依赖。下载:1329-3.patch拷贝至服务器上;
https://issues.apache.org/jira/secure/attachment/12630146/1329-3.patch