首先对测试K-Means来说,这个测试使用的 mahout org.apache.mahout.clustering.syntheticcontrol.kmeans.Job方法。
大多数网友对于这个测试都很疑惑就是在测试的时候总是报错,
显示“Input path does not exist: hdfs: **************”类似于此的。
我开始也被这个苦恼,后来自己弄明白原理就懂了,是因为这个测试的类的路径是固定的,如果你是开始创建的目录是/usr/。。。的,就绝对会报错。因为这个类使用的目录是/user的。接下来看如下的步骤:
首先前提是安装好hadoop与Mahout.
这里送上链接: