基于残差的提升树

最新推荐文章于 2022-01-06 12:10:32 发布

智元说车

最新推荐文章于 2022-01-06 12:10:32 发布

阅读量1.5k

点赞数 1

分类专栏：机器学习文章标签：机器学习提升算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012771351/article/details/52992836

版权

机器学习专栏收录该内容

35 篇文章 4 订阅

订阅专栏

注：本文中所有公式和思路来自于李航博士的《统计学习方法》一书，我只是为了加深记忆和理解写的本文。

首先应该先介绍一下提升树，提升树模型采用了加法模型和前向分布算法，基于决策树的提升也就是提升树，也就是多个基函数累加得来，这里的基函数我们可以广泛的指代我们常用回归或者分类器而不仅仅是y=ax+b这种直观的函数，例如决策树、SVM等，因为我们给定一个样本x会输出对应的预测值y，所以可以将决策树、SVM这些算法当成基函数f。

既然是基于残差的决策树，那么就有基于其他的决策树，后续还会介绍基于伪残差的决策树（GBDT），所谓残差就是样本x的标记值y与预测值的差值而已

提升树算法：

提升树是加法模型和前向分布算法的结合实现的，这个加法模型我们不妨用如下公式表达：

那么首先不出意外会要确定一个f₀(x₀)，这里不妨设定f₀(x)=0，那么第m步的模型应该是：

其中f_m-1(x)是当前的模型，f_m(x)是下一个要算的，通过经验风险极小化求得下一棵决策树的Θ_m

当采用平方误差作为损失函数时，则有

将f(x)带入公式，此时的损失为：

其中r = y - f_m-1(x)就是前边提到的残差，所以提升树实际是针对残差进行拟合的

具体算法如下：

到这就将提升树的推导过程以及算法介绍完了，实际上个人觉得这种方式会很容易过拟合，即使是后续要介绍的GBDT也是很有可能造成过拟合（个人认为）。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
基于残差的提升树

注：本文中所有公式和思路来自于李航博士的《统计学习方法》一书，我只是为了加深记忆和理解写的本文。首先应该先介绍一下提升树，提升树模型采用了加法模型和前向分布算法，基于决策树的提升也就是提升树，也就是多个基函数累加得来，这里的基函数我们可以广泛的指代我们常用回归或者分类器而不仅仅是y=ax+b这种直观的函数，例如决策树、SVM等，因为我们给定一个样本x会输出对应的预测值y，所以可以将决策树、
复制链接

扫一扫

专栏目录

博客等级

码龄11年

34
原创

67
点赞

118
收藏

64
粉丝

关注

私信

热门文章

分类专栏

机器学习 35篇
linux 2篇
deep learning 1篇

最新评论

HMM之前向后向算法
weixin_46083434: 你好，非常感谢你的讲解让我可以把前向算法和后向算法结合起来理解，不过还有两个问题不是很明白，1. 单个状态的概率那个公式，分母P(o|lamda) 换成alphat(i)*betat(i)再对所有i（状态）求和，是因为生成观测序列o的总概率是t时刻下每个i（状态）可能的概率之和吗？ 2. 最后那个联合概率转换到最终结果不太明白，请问可以请教一下再具体一点的步骤吗？谢谢
LDA-隐狄利克雷分布-主题模型
leilei9406: 想请问下如果做短文拼接可以有哪些方法，我正在做一个短文本的LDA结果不是很好，可以请教下您吗？
变分算法
qq_36711371: 请问一下，P（x）和q（x）的距离公式中，α=1的时候，公式为什么会退化为KL(p||q)，α=1时，分母为0.
HMM之前向后向算法
Chester_ieee: 前后向概率的公式，i和t好像是写反了。
聚类之层次聚类与密度聚类
落入凡间的奥特曼: 你好，请问这个机器学习升级版是课程吗?

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。