一、安装cygwin
在以上画面时将选项“Hide obsolete packages”去掉,并按view按钮显示Full(所有)安装包;在不改变默认选择的情况下,并选择以下包:XFree86-base、 XFree86-bin、XFree86-etc、XFree86-lib、XFree86-prog、gawk、gcc、gcc-g++、gnuplot、gzip、make、patch、perl、tar和openssh。选定一个安装包的方法是:先找到,然后在其前面的Skip上点一下。完成后点击“下一步”开始安装。
注:以上包可以部分安装
二、安装jdk1.6
三、安装hadoop
1、设置cygwin的环境变量
编辑/home/Administrator/.bashrc文件,在文件最后加入下列行:
export JAVA_HOME=/cygdrive/D/Java/jdk1.6.0_26
export classpath=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
2、安装hadoop
拷贝hadoop-0.15.3.tar.gz到/home/Administrator中,然后解压:tar xvfz hadoop-0.15.3.tar.gz, 把解压后目录名改为hadoop(方便操作)。修改配置文件/home/Administrator/.bashrc文件,在文件最后加入下列行:
exportHADOOP_HOME=/home/Administrator/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
3、配置
hadoop/conf/目录下,打开slaves文件,该文件用来指定所有的从节点,一行指定一个主机名。这里我们就指定localhost,表示hadoop在一台机器上运行。
四、安装maven
拷贝apache-maven-3.1.1-bin.tar.gz到/home/Administrator中,然后解压:tar xvfz apache-maven-3.1.1-bin.tar.gz, 把解压后目录名改为maven(方便操作)。修改配置文件/home/Administrator/.bashrc文件,在文件最后加入下列行:
export MAVEN_HOME=/home/Administrator/maven
并修改export PATH为:
export PATH=$PATH:$HADOOP_HOME/bin:$MAVEN_HOME/bin
五、Mahout的安装
拷贝mahout-distribution-0.9-src.tar.gz到/home/Administrator中,然后解压:tar xvfz mahout-distribution-0.9-src.tar.gz,把解压后的目录名修改为mahout。在mahout目录下,执行mvn clean && mvn compile && mvn -DskipTests install命令进行编译。然后,在MAHOUT_HOME/bin目录下,执行./mahout --help 可以看到mahout目前拥有的算法。
六、执行贝叶斯分类
在MAHOUT_HOME/bin目录下 执行./mahout trainclassifier -h 查看参数,然后执行贝叶斯分类。