机器学习之树模型

最新推荐文章于 2024-04-30 16:55:48 发布

jxzheng95

最新推荐文章于 2024-04-30 16:55:48 发布

阅读量434

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014683535/article/details/93348950

版权

机器学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

决策树模型，树的结构固定，自顶向下分叉。优化方法就是搜索某个特征的取值范围作为分支的界限。所以，各种决策树模型的体现在度量信息增益的方式，Formally讲，就是损失函数。回归树用MSE，分类树用交叉熵。

xgboost模型

推导第t步的损失函数

在这里插入图片描述

得到新的目标函数并进一步，将它分解为T个叶子节点上子目标函数之和（方便下边搜索树结构使用）。

解这个二次函数的最小值问题得到形式化的解法。

贪心法搜索树的结构。选择能让信息增益最大的feature和分界点。

总结

xgboost由加法模型分析得出一个第t步决策树的损失函数。首先加法模型总体的损失函数是MSE. 第t步的损失函数将前t-1步决策树预测的和看作变量，将第t步的决策树预测看作是泰勒展开式中的增量，然后将总体损失函数利用泰勒展开式展开到3项，将不含第t步预测的项当作常数略去。可以发现这个第t步的损失函数是二次函数，有形式化的解法，可以直接得到损失函数的最优解。进一步将这个第t步的损失函数规整为T个叶子节点损失函数之和。定义新的信息增益来搜索第t步的决策树。

参考文献

https://homes.cs.washington.edu/~tqchen/pdf/BoostedTree.pdf 陈天奇的讲义

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习之树模型

决策树模型，树的结构固定，自顶向下分叉。优化方法就是搜索某个特征的取值范围作为分支的界限。所以，各种决策树模型的体现在度量信息增益的方式，Formally讲，就是损失函数。回归树用MSE，分类树用交叉熵。xgboost模型推导第t步的损失函数得到新的目标函数并进一步，将它分解为T个叶子节点上子目标函数之和（方便下边搜索树结构使用）。解这个二次函数的最小值问题得到形式化的解法。贪心...
复制链接

扫一扫

专栏目录

jxzheng95 CSDN认证博客专家 CSDN认证企业博客

码龄10年

30: 原创

20万+: 周排名

114万+: 总排名

4万+: 访问

: 等级

761: 积分

6: 粉丝

16: 获赞

5: 评论

27: 收藏

私信

关注

热门文章

分类专栏

LeetCode 3篇
python 5篇
机器学习 7篇
编程 2篇
linux 1篇
c++ 1篇
基础算法模版 6篇

最新评论

差分数组和差分矩阵
xyy11233: 唯独看你这个看懂了
差分数组和差分矩阵
ChengSukai: tricks里面讲的实在是听不懂
浅谈Python中的yield表达式
杨二K: 确实看到很明白了。有时候就是很简单的道理，很多教程都很抽象不能让人一眼就明白。
浅谈Python中的yield表达式
无敌策哥: 讲的真好，，通透了，以前总是不怎么通透
python正则表达式——re模块的使用
黎明咬破夜的唇: 文章写的很好简单易懂但是有个问题哈我python是2.7我查了以下re.compile()的文档是Compile a regular expression pattern, returning a pattern object 这个方法的参数接受一个regular expression pattern 而作者写的返回一个这个对象不知道是py3改了还是作者笔误啊

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。