决策树：像做选择题一样做分类

最新推荐文章于 2025-10-28 20:06:17 发布

——米

最新推荐文章于 2025-10-28 20:06:17 发布

阅读量766

点赞数 19

CC 4.0 BY-SA版权

文章标签：决策树分类人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mez666/article/details/150492172

在机器学习的工具箱里，决策树是个特别 “接地气” 的算法。它的思路就像咱们平时做决定时列的选择题流程，一步一步问问题，最后得出结论。今天就用大白话来讲讲决策树到底是啥，咋工作的，再拿实际例子说说它咋给数据分类。

决策树到底是啥？就是一串选择题

决策树，光听名字就知道它像棵树 —— 有根、有枝、有叶子。简单说，它就是把分类过程变成一串 “是 / 否” 的选择题，从根节点开始问，顺着分支一步步往下走，最后走到叶子节点，就能得到分类结果了。

树的零件得认清

根节点：第一个问题，也是最重要的选择题，比如 “今天天气好吗？”
非叶子节点与分支：中间的问题和选项，比如天气好的话问 “有聚会吗？”，天气不好的话问 “作业急吗？”
叶子节点：最后答案，比如 “去打球”“在家学习”“看电视”。

不管是分类（比如判断是不是鱼类、天气好不好）还是回归（比如预测房价、成绩），决策树都能用，核心就是这套 “提问 - 分支 - 结论” 的流程。

策树咋训练？关键在 “怎么问问题”

训练决策树，说白了就是确定 “先问啥，再问啥”。测试的时候就简单了，顺着树走一遍就行。难就难在怎么构造这棵树 —— 第一个问题问啥？每个问题下面分几个选项？这得有讲究。

目标：让分类越来越 “纯”

咱们希望每个问题都能把数据分得更清楚。比如判断 “要不要打球”，第一个问题最好能把 “大概率打球” 和 “大概率不打球” 的情况分开，就像选个 “大当家” 来镇场子，后面的问题再当 “二当家” 细化分类。

那怎么判断哪个问题分的效果好呢？这就得靠 “熵” 和 “信息增益” 这两个工具了。

用 “熵” 衡量混乱程度

熵是个听起来玄乎其实特简单的概念 ——表示数据的混乱程度。数据越乱，熵越大；越整齐，熵越小。

公式长这样：H(X)=−∑pi×logpi（不用记公式，懂意思就行）。

如果一群数据全是同一类（比如 10 个样本全是 “是”），熵就是 0，一点不乱。
如果一半是 “是” 一半是 “否”，熵最大，乱成一锅粥。
比如 A 集合 [1,1,1,1,1,1,1,1,2,2]（大部分是 1），B 集合 [1,2,3,4,5,6,7,8,9,1]（啥都有），显然 B 的熵更大。

用 “信息增益” 选最好的问题

信息增益就是说，用某个特征（问题）分类后，数据的混乱程度（熵）减少了多少。减少得越多，这个特征就越好，越适合当当前的节点。

举个例子：14 天打球数据里，有 9 天打、5 天不打，初始熵是 0.940（有点混乱）。

用 “天气（outlook）” 分类：晴天（sunny）时熵 0.971，阴天（overcast）时熵 0，雨天（rainy）时熵 0.971。算下来总熵变成 0.693，信息增益就是 0.940-0.693=0.247。
再算其他特征（温度、湿度、风力）的信息增益，哪个最大就选哪个当根节点。

就像挑领导，谁能把团队管理得更整齐（混乱减少最多），谁就当老大。选好根节点后，再在每个分支里用同样的方法选下一个问题，直到所有数据都分清楚。

总结一下

决策树就像咱们平时做决定的思路，把复杂问题拆成一串小选择题，用 “熵” 看混乱程度，用 “信息增益” 挑最好的问题。它的好处是简单易懂，分类过程一目了然，就像跟着流程图走，哪怕不懂算法的人也能看明白。不管是给电影分类、判断是否是鱼类，还是生活中的各种决策场景，决策树都能帮咱们理清楚思路，一步步找到答案。下次再听到 “决策树”，就想想那些让你做选择的选择题流程，其实原理都差不多！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。