Python数据分析与机器学习38-Xgboost算法

本文介绍了集成算法的基本原理,并重点讲解了Xgboost算法。Xgboost是一种优化的目标函数驱动的集成方法,通过每轮选择能最大程度降低目标函数的基学习器进行迭代。文章通过公式和图解详细阐述了Xgboost的工作机制,包括如何构建决策树以优化加权和截距,以及如何通过叶子节点遍历实现高效计算。
摘要由CSDN通过智能技术生成

一. 集成算法简介

下图是一个集成算法的图解:
y = wx +b
第一个树用来求权重值w
第二个树用来求截距 b
多个树结合在一起,模型整体的实用性更佳。
image.png

二. Xgboost集成算法简介

下图是集成算法的公式:
image.png

目标函数:
image.png

如何最优函数解?
image.png

集成算法的表示:
image.png

image.png

现在还剩下一个问题,我们如何选择每一轮加入什么f呢?答案是非常直接的,选取一个f来使得我们的目标函数尽量最大地降低
image.png

在这里插入图片描述

image.png

image.png

通过公式,将样本上遍历转换为在叶子节点上遍历
image.png

image.png

image.png

三. 图解Xgboost算法

image.png

image.png

image.png

image.png

参考:

  1. https://study.163.com/course/introduction.htm?courseId=1003590004#/courseDetail?tab=1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值