文章目录
1 引言
关联规则挖掘(Association Rules Mining)或者关联分析(Association Analysis)最早是为了进行购物篮分析而提出的。关联规则可以用于对交叉营销和市场布局进行辅助决策。
- 经常一起购买的商品:没有先后或因果——频繁项集;
- 购买此商品也同时购买:涉及时间和顺序——关联规则。
2 频繁模式与关联规则
关联规则挖掘是从交易数据库、关系数据库以及其他的数据集中发现项或对象的频繁模式(frequent patterns)、关联( associations)的过程。
交易数据库Transactional database:
(1)支持度(Support):支持度指交易包含项集X的概率。
若support(X) >=最小支持度阈值minsup ,则X称为频繁项集(frequent itemset),也可以说X是频繁的。
(2)闭合频繁项集
一个频繁项集X被称为闭合频繁项集(closed frequent itemsetÿ