一、关联分析
关联分析主要是用于从数据集中发现数据项之间的关系。
1. 基本概念
1.1 支持度
X → Y 的支持度表示项集 {X,Y} 在总项集中出现的概率:
s u p p o r t ( X → Y ) = P ( X , Y ) support(X\rightarrow Y)=P(X,Y) support(X→Y)=P(X,Y)
用于衡量同时满足X和Y的概率。
1.2 置信度
X → Y 的置信度表示在先决条件 X 发生的情况下,由规则 X → Y 推出 Y 的概率。
c o n f i d e n t ( X → Y ) = P ( Y ∣ X ) confident(X\rightarrow Y)=P(Y|X) con