利用数据挖掘工具weka进行管理规则挖掘

前面几篇介绍了关联规则的一些基本概念和两个基本算法,但实际在商业应用中,写算法反而比较少,理解数据,把握数据,利用工具才是重要的,前面的基础篇是对算法的理解,这篇将介绍开源利用数据挖掘工具weka进行管理规则挖掘。 weka数据集格式arff   arff标准数据集简介   we...

2016-06-01 17:05:15

阅读数:709

评论数:0

FP_growth算法

FP_growth算法是韩家炜老师在2000年提出的关联分析算法,该算法和Apriori算法最大的不同有两点:第一,不产生候选集,第二,只需要两次遍历数据库,大大提高了效率,用31646条测试记录,最小支持度是2%,用Apriori算法要半个小时但是用FP_growth算法只要6分钟就可以了,效率...

2016-05-31 13:54:27

阅读数:413

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭