![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 70
写BUG的Jerry
这个作者很懒,什么都没留下…
展开
-
关联分析——基于h-confidence剪枝的Apriori算法
基于h-confidence剪枝的Apriori算法摘要倾斜支持度分布为何支持度和置信度失效如何解决Python实现生成候选1-项集并计算候选1-项集的支持度计数基于全置信度剪枝生成候选2-项集封装测试支持度剪枝h-confidence剪枝摘要当数据集存在倾斜支持度分布时,基于支持度剪枝的Apriori算法无法很好的提取频繁项集,这时需要根据h-confidence进行剪枝。倾斜支持度分布一个倾斜支持度分布的例子:基于支持度剪枝会产出如下问题:设定过高的支持度阈值会忽略掉一些有趣的规则;设定原创 2021-07-13 14:43:05 · 799 阅读 · 0 评论 -
关联分析——频繁项集的产生之Apriori算法
关联分析——频繁项集的产生之Apriori算法频繁项集的产生—Apriori算法Apriori算法的Python实现提取1-项集提取频繁k-项集生成候选k-项集Apriori算法封装频繁项集的产生—Apriori算法Apriori算法用于从数据集中提取频繁项集,以购物篮事务为例说明其过程:提取频繁项集的过程如下:Apriori算法的伪码如下:Apriori算法的Python实现给出数据集:data = [[1, 3, 4], [2, 3, 5], [1, 2, 3, 5], [2, 5原创 2021-07-13 10:15:50 · 5213 阅读 · 1 评论