万事开头难,上午看了一下基于物品的协同过滤的算法的原理,于是下午决定练练手。
本以为按照书上的命令来敲会很顺利,然而好事多磨,花了大半个下午才搞好。
刚开始就发现我看得书上的命令有问题,真是坑,又找了另一本mahout的书来看。
先在hdfs下建好相应的文件夹,并把输入文件传上去。
然后敲如下一段正确的命令:
hadoop jar /usr/local/mahout-distribution-0.9/mahout-examples-0.9-job.jar org.apache.mahout.cf.taste.hadoop.item.RecommenderJob -i /test/input/user_item.txt -o /item/output -n 3 -b false -s SIMILARITY_EUCLIDEAN_DISTANCE --maxPrefsPerUser 7 --minPrefsPerUser 2 --maxPrefsPerUser 2
然而