1 关联规则
关联分析一个典型的例子是购物篮分析,广泛应用于零售业,通过查看那些商品经常在一起购买,可以帮助商店了解用户的购买行为。一个最有名的例子是“尿布与啤酒”,据报道,美国中西部的一家连锁店发现,男人们会在周四购买尿布和啤酒,这样商家实际上就可以将尿布和啤酒放在一块,并确保在周四全价销售从中获利。
关联分析(关联规则学习):从大规模数据集中寻找物品间的隐含关系
但是一般销售数据库巨大,如何快速找到数据库中物品之间的联系成为主要的难题,Apriori算法在1996年应运而生,改算法可以高效的找出频繁项集,并从频繁项集中抽取除关联规则。当然,该算法不仅应用在零售业,在特征关联等领域也有广泛应用。
关联分析中所需的两个度量公式:
1. 频繁项集度量支持度(support):
support(x,y)=numberofbuy(x,y)allof