1. Mahout0.9—Hadoop2.20—FPG关联规则算法
1.1. FPG函数
目前Mahout0.9 无fpg函数,0.9之前版本有,但是在0.9中可以找到fpg的jar包;mahout org.apache.mahout.fpm.pfpgrowth.FPGrowthDriver 等价于 fpg;
1) fpg参数(mahout org.apache.mahout.fpm.pfpgrowth.FPGrowthDriver)
-- minSupport,最小支持度,默认3
-- maxHeapSize,最大项集,默认50
-- numGroups,分组数量
-- splitterPattern,数据分割符,如:" \"[ ,\\t]*[,|\\t][ ,\\t]*\" ", "[ ,\t]*[,|\t][ ,\t]*"
-- numTreeCacheEntries,fpg树数量,Values: [5-10]", 默认"5"
-- method,sequential|mapreduce,并行或者串行计算;
-- encoding,编码,Default value: UTF-8", "UTF-8"
-- useFPG2