通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,叫做商品关联分析法,即“购物篮分析”。通过企业数据分析平台帆软实现对企业数据购物篮分析,具体数据分析的形式将以数据可视化仪表板的形式展现出来。
目录
1.知识准备
1.1 支持度(support)
支持度是对关联规则重要性的衡量
定义:支持度是指A商品和B商品同时被购买的概率,或者说某个商品组合的购买次数占总商品购买次数的比例。
支持度说明了这条规则在所有事务中有多大的代表性,显然支持度越大,关联规则越重要。
概率描述:物品集A对物品集B的支持度support(A==>B)=P(A n B)
实例说明:今天共有10笔订单,其中同时购买牛奶和面包的次数是6次,那么牛奶+面包组合的置信度就是6/10=60%
1.2 置信度(confidence)
置信度是对关联规则的准确度的衡量
定义:置信度是指购买A之后又购买B的条件概率,简单说就是因为购买了A所以购买了B的概率。
计算公式:物品集A对物品集B的置信度confidence(A==>B)=P(A|B)
实例说明:今天共有10笔订单,其中购买A的次数是8,同时购买A和B的次数是6,则其置信度是6/8=75%
1.3 提升度(lift)
定义:先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,是看组合商品被购买的次数是否高于单独商品的购买次数,大于1说明该组合方式有效,小于1则说明无效。</