一、基本概念
1.支持度(support)
支持度是指在所有项集中{X,Y}出现的可能性,即项集中同时含有X和Y的概率
support(X→Y)=P(X,Y)
通过最小阈值的设定,剔除频率较低的无意义规则。满足
support(Z)>=minsup
的项集Z,称为频繁项集。
2.置信度(confidence)
置信度表示在关联规则的先决条件X发生的条件下,关联结果Y发生的概率,即在含有X的情况下含有Y的条件概率
confidence(X-Y)=P(Y|X)
置信度衡量了关联规则在“质量”上的可靠性。同样采用最小阈值选出满足confidence(Z)>=mincon的强关联规则
3.提升度(lift)
提升度为Y自身出现的概率P(Y)与含有X的情况下含有Y的条件概率P(Y|X)之比。其值越大(>1),表面X对Y的提升成都