Mahout是Apache下的开源的机器学习算法库,是基于Hadoop的.
在搭建完分布式的Hadoop之后,可以搭建Mahout环境和开发环境.
环境:
Ubuntu 12.10
jdk 1.7
Hadoop 0.20.2
Eclipse 3.5.2
Mahout 0.7
Maven 3.1.1
第一步:Mahout的安装与配置 参见Ruthless的博客http://www.cnblogs.com/linjiqin/archive/2013/03/15/2961649.html第二步:安装Maven,Maven是项目构建和文档管理工具,Mahout源码工程中用到了Maven,很多大型企业也用这个工具.
参见jesse的博客http://blog.csdn.net/s_niper/article/details/6621019第三步:Eclipse安装配置Maven.对于Eclipse3.6之后的版本,可以通过Eclipse的Marketplace来添加,像3.5.2的版本可以打开Eclipse的help->software中地址输入
http://download.eclipse.org/technology/m2e/releases/
第四步:Eclipse下mahout配置与使用,直接在http://labs.renren.com/apache-mirror/mahout/0.7下载 mahout-distribution-0.7-src.tar.gz 然后解压缩之后,在Eclipse中选择import现有Maven项目,即可.第五步:Eclipse下Maven项目的开发,参见http://www.iteye.com/topic/1123225