task10

最新推荐文章于 2024-05-03 11:52:45 发布

置顶模型收敛了嘛

最新推荐文章于 2024-05-03 11:52:45 发布

阅读量120

点赞数

分类专栏： ML 文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39534398/article/details/92798909

版权

ML 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

阅读《李航统计学习方法》的65-74页
- 学习Gini指数
- 学习回归树
- 剪枝

CART算法

1984年提出，1和2由此引入，CART算法同样由特征选择、树生成、剪枝组成，既可用来分类也可用于回归。

分类树的生成
本质是递归的构建二叉决策树，回归树用平方误差最小化准则，分类树用Gini指数选择最优特征，同时决定该特征的最优二值切分点。
- 回归树的生成：
  
  停止条件可以为树深度等。
- 分类树生成：
- Gini指数：分类问题中，假设有K个类，样本点属于第k类的概率为 $p_{k}$ ，则概率分布的Gini指数定义为：
  $Gini(p)=\sum_{k=1}^{K}p_{k}(1-p_{k})=1-\sum_{k=1}^{K}p_{k}^{2}$
  对于二分类问题：
  $G i n i (p) = 2 p (1 - p)$
  对于给定的样本集合D：
  $Gini(p)=1-\sum_{k=1}^{K}\left ( \frac{\left | C_{k} \right |}{|D|} \right )^{2}$
  如果样本集合D根据特征A是否为a被分割成D1和D2，即：
  $D_{1}=\{ (x,y)\in D|A(x)=a)\},D_{2}=D-D_{1}$
  则在特征A的条件下，集合D的基尼指数：
  $Gini(D,A)=\frac{D_{1}}{D}Gini(D_{1})+\frac{D_{2}}{D}Gini(D_{2}))$
  Gini $G i n i (D)$ 指数表示集合D的不确定性，Gini(D,A)表示经过A=a分割后D的不确定性。Gini指数越大表示不确定性越大。
- 下图显示二分类问题中Gini指数、1/2熵和分类误差率的关系。横坐标表示概率，纵坐标表示损失。可以看出基尼指数和熵之半的曲线很接近，可以近似地表示分类误差率。

剪枝

剪枝：决策树过拟合风险很大，理论上可以完全分得开数据
策略：
- 预剪枝:一边建立树一边进行剪枝操作
- 后剪枝:当建立完决策树后进行剪枝操作
预剪枝：限制深度，叶子节点个数，叶子节点样本数，
后剪枝：通过一定标准衡量
决策树的剪枝往往通过极小化决策树整体的损失函数来实现，设树T的叶结点个数为|T|，t是树T的叶结点，该叶结点有 $N_{t}$ 个样本点，其中k类的样本点有N_{tk}个，k=1,2,…,K，H_{t}(T)为叶结点t上的经验熵， $\alpha\geq 0$ 为参数，则决策树学习的损失函数可以定义为。
$C_{a}(T)=\sum_{t=1}^{\left | T \right |}N_{t}H_{t}(T)+\alpha |T|$

$\sum_{t=1}^{\left | T \right |}N_{t}H_{t}(T)$ 表示模型对训练数据的预测误差，即模型与训练数据的拟合程度，|T|表示模型复杂度，参数 $\alpha\geq0$ 控制两者之间的影响。

模型收敛了嘛

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
task10

阅读《李航统计学习方法》的65-74页学习Gini指数学习回归树剪枝CART算法1984年提出，1和2由此引入，CART算法同样由特征选择、树生成、剪枝组成，既可用来分类也可用于回归。分类树的生成本质是递归的构建二叉决策树，回归树用平方误差最小化准则，分类树用Gini指数选择最优特征，同时决定该特征的最优二值切分点。回归树的生成：停止条件可以为树深度等。...
复制链接

扫一扫

专栏目录

模型收敛了嘛 CSDN认证博客专家 CSDN认证企业博客

码龄7年

16: 原创

71万+: 周排名

148万+: 总排名

2053: 访问

: 等级

195: 积分

0: 粉丝

0: 获赞

1: 评论

2: 收藏

私信

关注

热门文章

分类专栏

ds 1篇
ML 9篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。