基本概念
对于 A→B
支持度(support):
P(A∩B) ,既有A又有B的概率
置信度(Confidence Strength):
conf(A→B)=sup(A∪B)sup(A)=P(B|A)
即,在A发生的事件中同时发生B的概率
例如购物篮分析:牛奶 ⇒ 面包
例子:[支持度:3%,置信度:40%]
支持度3%:意味着3%顾客同时购买牛奶和面包
置信度40%:意味着购买牛奶的顾客40%也购买面包
候选集(Candidate itemset):
通过向下合并得出的项集。
定义为C[k]。
频繁集(Frequent itemset):
支持度大于等于特定的最小支持度(Minimum Support/minsup)的项集。表示为L[k]。
提升比率(提升度Lift):
lift(X