在Mahout中出现错误:MAHOUT_LOCAL is not set;adding HADOOP_CONF_DIR to classpath
MAHOUT_LOCAL与HADOOP_CONF_DIR
以上的两个参数是控制Mahout是在本地运行还是在Hadoop上运行的关键。
$MAHOUT_HOME/bin/mahout
文件指出,只要设置MAHOUT_LOCAL
的值为一个非空(notempty string)值,则不管用户有没有设置HADOOP_CONF_DIR和HADOOP_HOME这两个参数,Mahout都以本地模式运行;换句话说,如果要想Mahout运行在Hadoop上,则MAHOUT_LOCAL必须为空。
HADOOP_CONF_DIR
参数指定Mahout运行Hadoop模式时使用的Hadoop配置信息,这个文件目录一般指向的是$HADOOP_HOME目录下的conf目录。
除此之外,我们还应该设置JAVA_HOME
或者MAHOUT_JAVA_HOME
变量,以及必须将Hadoop的执行文件加入到PATH中。