关联分析时,需要处理两个关键问题
1 大量数据集中发现模式,计算代价高
2 某些模式可能是虚假的,因为他们是偶然发生的
关联分析例题:从这个商品记录得出顾客喜欢同时购买那几样东西
TID | 面包 | 牛奶 | 尿布 | 啤酒 | 鸡蛋 | 可乐 |
1 | 1 | 1 | 0 | 0 | 0 | 0 |
2 | 1 | 0 | 1 | 1 | 1 | 0 |
3 | 0 | 1 | 1 | 1 | 0 | 1 |
4 | 1 | 1 | 1 | 1 | 0 | 0 |
5 | 1 | 1 | 1 | 0 | 0 | 1 |
6 | 1 | 1 | 0 | 0 | 0 |
关联分析时,需要处理两个关键问题
1 大量数据集中发现模式,计算代价高
2 某些模式可能是虚假的,因为他们是偶然发生的
关联分析例题:从这个商品记录得出顾客喜欢同时购买那几样东西
TID | 面包 | 牛奶 | 尿布 | 啤酒 | 鸡蛋 | 可乐 |
1 | 1 | 1 | 0 | 0 | 0 | 0 |
2 | 1 | 0 | 1 | 1 | 1 | 0 |
3 | 0 | 1 | 1 | 1 | 0 | 1 |
4 | 1 | 1 | 1 | 1 | 0 | 0 |
5 | 1 | 1 | 1 | 0 | 0 | 1 |
6 | 1 | 1 | 0 | 0 | 0 |