决策树
信息熵
公式: H ( X ) = − ∑ x ∈ X P ( x ) l o g P ( x ) H(X)=-\sum_{x\in X}P(x)logP(x) H(X)=−∑x∈XP(x)logP(x),H(X)称为X的信息熵,反映了X的信息量。
信息增益:g(D,A) = H(D)-H(D|A)为得知特征A下使得D的信息不确定性减少的程度。
信息增益的计算
H ( D ) = − ∑ k = 1 K ∣ C k ∣ ∣ D ∣ l o g ∣ C k ∣ ∣ D ∣ H(D)=-\sum_{k=1}^{K}\frac{|C_k|}{|D|}log\frac{|C_k|}{|D|} H(D)=−∑k=1K∣D∣∣Ck∣log∣D∣∣Ck∣
H ( D ∣ A ) = ∑ i = 1 n ∣ D i ∣ ∣ D ∣ H ( D i ) H(D|A)=\sum_{i=1}^{n}\frac{|D_i|}{|D|}H(D_i) H(D∣A)=∑i=1n∣D∣∣Di