Apriori算法的指标体系:
Apriori算法生成的关联规则包含三个指标:支持度(Support)、置信度(Confidemce)、提升度(Lift),一般使用支持度-置信度二个指标判断事务之间关联关系的强弱,因此也被称为支持度-置信度框架(Support-Confidence Framework)。
如何判断一个购物篮数据集合中,那些商品之间是强关联、那些是弱关联,Apriori算法方法是,对于支持度和置信度都设置一个最小值,即设置一个筛选条件(阈值),以此判断事务之间关联关系的强弱,对于上面的5个购物篮,可以设置支持度最小值为30%,置信度的最小值为50%,那么{苹果、牛奶}的关联关系就是强,其他的都是弱,可以予以忽略。
Apriori算法指标案例:
Apriori算法产生后,不断有国外零售企业进行尝试使用,对卖场中的关联关系进行描述,下面就是几个实际案例。
案例1:某超市的熟食、面包、肉类三种商品品类之间关联关系表;
表3-1为某超市使用的熟食、面包、肉类的关联关系表,这个报表中采取了标准的Apriori算法指标,即支持度(Support)、置信度(Confidence)及提高度(Lift)3个指标,表格中的“—〉”符号指明了商品之间关联关系的方向,即从表格左侧到右侧的方向,左侧代表主分析的商品,右侧代表被关联的商品。
在这个报表中重点指标是提高度(Lift