ID3算法 ,C4.5 ,CART
ID3 信息论,信息熵 p(X)为概率,0-1范围所以熵永远大于0
单调性,发生概率越高的时间,所携带的信息熵越低
非负性
累加性 两个独立事件同时发生的信息熵H(A,B)=H(A)+H(B)
该算法利用信息增益来决定优先使用哪个特征进行分裂,信息增益越大就进行该特征分类
信息增益 :划分之前的信息熵减去划分之后的信息熵叫信息增益
A对D划分的期望信息为:
优点ID3复杂度不高
ID3算法对于离散型特征比如多加一类1,2,3...处理不好,引入C4.5算法
C4.5 算信息增益率
CART:gini系数 在decisiontreeclassifier函数里,尽可能分类的数据纯没有杂质
容易过拟合 要剪枝
max_depth 控制树的最大深度
min_sample_split=8 最小分割样本数
min_sample_leaf=4
随机森林 就是 很多树的结果平均,使结果不会过拟合