算法面试必备-----决策树

最新推荐文章于 2022-06-02 15:13:56 发布

Avery123123

最新推荐文章于 2022-06-02 15:13:56 发布

阅读量385

点赞数

分类专栏：算法岗面试笔试准备

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/avery123123/article/details/106837353

版权

算法岗面试笔试准备专栏收录该内容

32 篇文章 12 订阅

订阅专栏

算法面试必备-----决策树

建立决策树基本流程

在这里插入图片描述

划分选择的准则（不同的启发函数）

准则一：最大信息增益（ID3算法）

信息熵

在这里插入图片描述

信息增益

在这里插入图片描述

ID3算法公式推导（使用信息增益）

公式

在这里插入图片描述

算法流程推导

从根节点信息熵开始
分别计算每个特征的信息增益
在这里插入图片描述

选取最大的信息增益

进一步划分，选一个新的信息划分起点

再次选取最大信息增益
进一步划分，选一个新的信息划分起点

再次选取最大信息增益

其他的特征也一样

ID3算法的不足

在这里插入图片描述

为什么信息增益会偏向于取值多的特征

在这里插入图片描述

准则二：最大信息增益率（C4.5算法）

应对 ID3算法利用信息增益划分，造成划分倾向于划分属性多的特征

信息增益率

在这里插入图片描述

特点及使用

对可取数目较少的属性有所偏好

使用方法：
在这里插入图片描述

C4.5 算法公式推导（使用信息增益率）

公式

在这里插入图片描述

C4.5算法的不足

在这里插入图片描述

准则三：最大基尼指数（CART算法）

基尼指数

在这里插入图片描述

CART算法公式推导

在这里插入图片描述

分类树：基尼指数最小原则

样本集合D的Gini指数

在这里插入图片描述

回归树：平方误差最小准则

剪枝处理

预剪枝

容易造成欠拟合
在这里插入图片描述

后剪枝

过程复杂，但是效果好！
在这里插入图片描述

在这里插入图片描述
此时共 5 个内部结点可供考虑，其中

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
算法面试必备-----决策树

算法面试必备-----决策树算法面试必备-----决策树算法面试必备-----决策树
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。