Python数据挖掘与机器学习——决策树算法代码实现
建立IF-THEN分类规则,即每个内部属性值形成规则前件(IF部分)的一个合取项,叶子结点形成规则后件(THEN部分)注意这里对数函数以2为底是因为信息用二进制位编码,但并非不可改变。无条件熵反映了该属性中各类别取值的平均自信息量,即平均不确定值。决策树由:根节点、内部节点和叶子节点。前两者的作用在于根据属性对对对象进行划分,而后者是分类的结果。熵是指类别属性的不确定性,而决策树算法的本质是通过描述属性从而减少熵。通过特征重要性的表格可以观察到不同特征的重要程度。是该属性分类出现的概率。
原创
2023-05-23 21:41:07 ·
995 阅读 ·
0 评论