?关联规则挖掘
从数据的项集之间发现有趣的, 频繁出现的模式关联和相关性.
购物篮分析,分类设计, 捆绑销售和亏本销售
购物篮分析
-如果问题的全域是商店中所有商品的集合, 则对每种商品都可以用一个不二良来表示该商品是否被顾客购买, 则每个购物篮都可以用一个布尔量表示; 而通过分析不二向量则可以得到商品被频繁关联或被同事购买的模式, 这些模式可以用关联规则表示.(ex. 10010010000 这种方法损失了购买的数量但是不影响购物篮分析)
基本概念
- 关联规则的两个兴趣度度量
1. 支持度: 事务集中包含 A⋃B 的百分比
这里的并集符号并不是指数学意义上的并集而是指 Customerbuysboth
2. 置信度: D中包含A的事务同时也包含B的百分比
例子
TID | item |
---|---|
2000 | ABC |
1000 | AC |
4000 | AD |
5000 | BEF |
假设最小支持度为50%, 最小置信度为50%则有
- A→C(50
- C→A(50
大型数据库关联规则过程
概念
关联规则分类
单维布尔关联规则挖掘
- 最简单的关联规则挖掘, 即单维, 单层, 布尔关联规则的挖掘.