数据挖掘
文章平均质量分 91
preeminence1
这个作者很懒,什么都没留下…
展开
-
数据挖掘十大算法之Apriori算法原理及源码实现
一、基本概念 频繁模式:指频繁地出现在数据集中的模式。例如,频繁地同时出现在交易数据集中的商品(如牛奶和面包)的集合就是频繁项集。 支持度:支持度的公式是support(A->B) = P(A U B),即A和B同时出现的概率。 置信度:置信度大的公式是confidence ( A-> B ) = P(A | B) = support ( A U B) / suppo原创 2015-01-17 21:31:16 · 5097 阅读 · 0 评论 -
关联规则挖掘算法Aprior和FPGrowth对比与改进
Aprior算法和FPGrowth算法同属于关联规则挖掘算法,但Aprior是基于广度优先的,而FPGrowth是基于深度优先的,即Aprior算法需要建立K项集,然后扫描数据库;而FPGrowth算法则是扫描数据库,然后查找频繁项集。Aprior算法Aprior算法的原理和实现参见http://blog.csdn.net/olaking/article/details/42810865和http:原创 2016-03-02 22:30:52 · 4005 阅读 · 0 评论