思想:找出频繁项集,逐层产生规则
是关联规则的一个重要算法,使用基于支持度的剪枝技术,从而控制候选项集的指数级别的增长
大体流程先知
- 1.设定最小支持度和最小置信度
- 2.扫描数据集,统计每个项的支持度计数,得到候选1项集
- 3.计算每个项的支持度计数,筛选掉小于最小支持度的,得到频繁1项集
- 4.合并再计算每个2项集的支持度计数得到候选2项集
- 5.筛选掉小于最小支持度的,得到频繁2项集
- 6.以此类推,当没有新的频繁项集产生后(即没有小于最小支持度的),迭代结束
- 7.采用逐层的思想筛选强规则的
一分钟看图
两分钟看手写真迹
候选项集的产生(补充)
在这里插入图片描述
文章转载 :https://blog.csdn.net/qq_42363032/article/details/111111639