统计学习--04决策树

最新推荐文章于 2024-10-20 18:23:51 发布

FlitDu

最新推荐文章于 2024-10-20 18:23:51 发布

阅读量252

点赞数

分类专栏：机器学习文章标签：决策树学习机器学习

本文链接：https://blog.csdn.net/YUNFEIYAHG/article/details/124509098

版权

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

决策树是一种树模型，可以看成一个 if-then 规则的集合，属于生成模型
决策树学习通常包括3个步骤：特征选择，决策树的生成和修剪
决策树学习本质上是从训练数据中归纳出一组分类规则

策略

决策树的选择策略要用到熵
熵 S 最初来源于物理学，其物理意义是体系混乱程度的度量，定义如下：在这里插入图片描述
在信息论和概率统计中，熵表示随机变量不确定性的度量，在这里可以理解为‘纯度’

信息熵可以看成损失函数，特征的选择则是要使模型的信息熵减小（信息增益最大），通过划分使样本集合越来越纯
在这里插入图片描述