数据发掘之关联规则学习(一)
关联规则(association rule)用来描述两个或多个事物之间的关联性,其通过一件或多件事物来预测其它事物,可以从大量数据中获取有价值数据之间的联系。 举个简单的例子,在超市中,顾客一般会购买多件商品,其搭配组合的信息可以帮助超市优化商品放置,提高产品销量。 比方说,购买 A 的顾客很多会同时购买 B。除了像筷子、碗这些显而易见关联物品外,通过关联规则学习还可以发现一些不一样的规则,如
爱吃西瓜的番茄酱:啤酒与尿布的故事zhuanlan.zhihu.com一、概念
例子:超市
定义:
- itemset: 项目集合
- k-itemset: k件项目的集合
- 支持度计数(support count,
): 特定项目集合出现的频数
- 例:
- 支持度(support,
):特定项目集合出现的比例
- 例:
- 频繁项集(frequent