文章目录
1.实验主要内容
主要:
- 实现先验算法(Apriori算法)
- 打印出来(每一步的)频繁项集
- 计算支持度 置信度(自写代码来实现)
找出符合最小支持度的频繁项集&符合最小置信度的强关联的关系
2.重要概念
关联规则挖掘
关联规则的目的:
在事务、关系数据库中的项集和对象中发现频繁模式、关联规则、相关性或者因果结构
频繁模式:数据库中频繁出现的项集
关联规则挖掘过程:
给定事务的集合 T, 关联规则发现是指找出支持度大于等于 min_sup并且置信度大于等于min_conf的所有规则。
min_sup 对应的支持度阈值
min_conf 对应的置信度阈值
关联规则的形式
关联规则是形如的蕴含表达式
其中 X 和 Y 是不相交的项集
支持度
置信度
频繁项集
满足最小支持度阈值(min_sup)的所有项集
<