机器学习之决策树
决策树几种常见的生成算法
ID3算法
- 选择信息增益最大的特征
信息增益的定义:
已知特征X的信息而使得类Y的信息的不确定性减少的程度。
g ( D , A ) = H ( D ) − H ( D ∣ A ) g\left( {D,A} \right){\rm{ = }}H\left( D \right){\rm{ - }}H\left( {D|A} \right) g(D,A)=H(D)−H(D∣A)信息增益具体计算方法:- 计算数据集的经验熵H(D)
H ( D ) = − ∑ k = 1 K ∣ C k ∣ ∣ D ∣ log 2 ∣ C k ∣ ∣ D ∣ H\left( D \right){\rm{ = - }}\sum\limits_{k = 1}^K {\frac{ {\left| { {C_k}} \right|}}{ {\left| D \right|}}{ {\log }_2}\frac{ {\left| { {C_k}} \right|}}{ {\left| D \right|}}} H(D)=−k=1∑K∣D∣∣Ck∣log2∣D∣∣Ck∣D表示样本的数量, C k {C_k}
- 计算数据集的经验熵H(D)