左图的点是一种线性不可分的情况,无法拿一条直线去将进行分开。
每一个节点都代表一个决策,从而导致节点的分流。
最终的目标肯定是要达到分类。
但取得目标的过程是有所谓的好坏。
而这个好坏用熵/信息增益来衡量。
熵是一种用于反映系统混乱程度的物理量。
信息增益用于反映新系统和旧系统的熵差。
熵的差值越大,说明这个分法能够导致系统更加稳定,效果更好。
机器学习|决策树
最新推荐文章于 2024-11-03 19:12:44 发布
本文讨论了在机器学习中,如何通过线性不可分的数据点构建决策树,利用熵和信息增益评估分法的有效性,以提高分类的稳定性和效率。
摘要由CSDN通过智能技术生成