(1)求信息增益 (信息增益越大越好!!!)
①总体的信息熵
②属性的信息熵
属性的信息熵 = “属性中各子集的信息熵 * 其比例,求和”
③属性的信息增益
属性的信息增益 = 整体信息熵 - 属性信息熵。
(2)求Gini指数 (Gini指数越小越好!!!)
①计算各子集的Gini指数
②依比例求和得到属性的Gini指数
属性的Gini指数 = “属性中各子集的Gini指数 * 其比例,求和”;
(1)求信息增益 (信息增益越大越好!!!)
①总体的信息熵
②属性的信息熵
属性的信息熵 = “属性中各子集的信息熵 * 其比例,求和”
③属性的信息增益
属性的信息增益 = 整体信息熵 - 属性信息熵。
(2)求Gini指数 (Gini指数越小越好!!!)
①计算各子集的Gini指数
②依比例求和得到属性的Gini指数
属性的Gini指数 = “属性中各子集的Gini指数 * 其比例,求和”;