关联规则(Association Rules)
1. 关联规则的产生
关联规则最初是为了解决购物篮问题而产生。购物篮分析(Market Basket Analysis),20世纪90年代,大概是1993年,Agrawal等人第一次提出了关联规则的概念。到目前为止,我们最熟悉的故事就是啤酒和尿布的故事。
故事原型:90年代,数据库技术飞速发展。作为大型的米国连锁超市,沃尔玛自然而然的引进了这套数据库系统。据说有一个叫做Joke的年轻人,在数据分析中发现,啤酒和尿布这两种完全不着边际的商品竟然有很高的概率一起被购买,这引起了他的兴趣。在一段时间之后,他终于分析出了原因:
在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲去超市买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒。所以尿布和啤酒一起出现的概率就很高。
所以他采取的方式方法是: