本来想在windows环境下运行mahout处理一些数据问题,没想到cygwin中运行mahout遇到的问题让我很头疼。下面记录一些遇到的问题:
1、$MAHOUT_HOME/bin/下的mahout脚本中默认的MAHOUT_CONF_DIR是"$MAHOUT_HOME/src/conf",但是发行版与源码是两个独立的包,故发行版中没有src目录,不过倒是有conf,这个地方可能会出现[color=red]”WARN driver.MahoutDriver: No org.apache.mahout.clustering.syntheticcontrol.canopy.Job.props found on classpath, will use command-line arguments only“[/color],不过我没有遇到过。
解决方法:将MAHOUT_CONF_DIR=$MAHOUT_HOME/src/conf修改为MAHOUT_CONF_DIR=$MAHOUT_HOME/conf
2、运行mahout脚本时很有可能出现图中的问题
[align=center][img]http://dl.iteye.com/upload/attachment/594286/f340cede-e706-3319-9139-65542edfd83a.jpg[/img][/align]
折腾了半天无果后,从某同学的博客中得知了解决方法[url]http://blog.sina.com.cn/s/blog_6102461a0100p6rz.html[/url],原因是windows与linux的路径分隔符不同。
解决方法:在$MAHOUT_HOME/bin/mahout脚本中找到[color=red]# run it[/color]这一行,另起一行,添加如下语句:MAHOUT_JOB=`cygpath -wp $MAHOUT_JOB`
1、$MAHOUT_HOME/bin/下的mahout脚本中默认的MAHOUT_CONF_DIR是"$MAHOUT_HOME/src/conf",但是发行版与源码是两个独立的包,故发行版中没有src目录,不过倒是有conf,这个地方可能会出现[color=red]”WARN driver.MahoutDriver: No org.apache.mahout.clustering.syntheticcontrol.canopy.Job.props found on classpath, will use command-line arguments only“[/color],不过我没有遇到过。
解决方法:将MAHOUT_CONF_DIR=$MAHOUT_HOME/src/conf修改为MAHOUT_CONF_DIR=$MAHOUT_HOME/conf
2、运行mahout脚本时很有可能出现图中的问题
[align=center][img]http://dl.iteye.com/upload/attachment/594286/f340cede-e706-3319-9139-65542edfd83a.jpg[/img][/align]
折腾了半天无果后,从某同学的博客中得知了解决方法[url]http://blog.sina.com.cn/s/blog_6102461a0100p6rz.html[/url],原因是windows与linux的路径分隔符不同。
解决方法:在$MAHOUT_HOME/bin/mahout脚本中找到[color=red]# run it[/color]这一行,另起一行,添加如下语句:MAHOUT_JOB=`cygpath -wp $MAHOUT_JOB`