关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。
关联规则揭示了数据项间的未知的依赖关系,根据所挖掘的关联关系,可以从一个数据对象的信息来推断另一个数据对象的信息。
例如购物篮分析。牛奶 ⇒ 面包 [支持度:3%,置信度:40%]
支持度3%:意味3%顾客同时购买牛奶和面包。
置信度40%:意味购买牛奶的顾客40%也购买面包。
规则的支持度和置信度是两个规则兴趣度度量,它们分别反映发现规则的有用性和确定性。
这里就使用SQL做简单的购物篮分析(仅实现单维关联规则算法)。
声明1: 使用的数据全部都是随机造出的,因此,分析的结果不代表真实的场景。
声明2: 此次分析过程在Mysql中实现。
建表语句如下:
CREATE TABLE shopcart (
car VARCHAR(50),
product VARCHAR(200)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;
数据文件见附件。
数据格式如下:
cart,product
shopcart_1,家具/家具定制/宜家代购
shopcart_10,玩具/模型/娃娃/人偶
shopcart_10,个人护理/保健/按摩器材
shopcart_10,奶粉/辅食/营养品
shopcart_10,品牌手表/流行手表
shopcart_10,酒店客栈/景点门票/度假旅游
shopcart_100,个人护理/保健/按摩器材
shopcart_100,珠宝/钻石/翡翠/黄金