sklearn笔记22 梯度提升树原理

最新推荐文章于 2024-04-13 18:51:54 发布

可可茜里的传说

最新推荐文章于 2024-04-13 18:51:54 发布

阅读量281

点赞数

分类专栏： python scikit-learn模块文章标签： sklearn python 人工智能

本文链接：https://blog.csdn.net/weixin_44632711/article/details/121126674

版权

完整代码 sklearn代码16 6-梯度提升树原理

此实验中数据比较简单，主要是为了分析梯度提升树执行的原理

import numpy as np

import matplotlib.pyplot as plt
%matplotlib inline

# 回归是分类的极限思想
# 分类的类别多到一定程度,就是回归

from sklearn.ensemble import GradientBoostingClassifier,GradientBoostingRegressor
from sklearn import tree

# X数据：上网时间和购物金额
# y目标:14 16, 24,26
X = np.array([[800,3],[1200,1],[1800,4],[2500,2]])

y = np.array([14,16,24,26])

gbdt= GradientBoostingClassifier(n_estimators=10)

gbdt.fit(X, y)

在这里插入图片描述

gbdt.predict(X)

gbdt[0,0].predict(X)

gbdt[-1,0].predict(X)

# 使用回归
gbdt = GradientBoostingRegressor(n_estimators=10)

gbdt

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

可可茜里的传说

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

【Sklearn】基于梯度提升树算法的数据分类预测（Excel可直接替换数据）

敲代码两年半的练习生博客

08-15

1137

每次迭代都会给新的弱学习器分配一个权重，最终的预测结果是所有弱学习器的加权组合。迭代地训练多个弱学习器，每个弱学习器都试图拟合上一个弱学习器的残差（预测误差），从而将模型逐步改进。初始化时，可以用一个简单的模型来进行预测，然后逐步改进模型，减小预测误差。梯度提升树通过逐步优化模型的预测值，将多个弱学习器组合成一个强学习器，从而在解决分类和回归问题时取得较好的性能。在每一轮迭代中，计算每个样本点的负梯度，即损失函数关于模型预测的梯度的负值。更新模型的预测值，将当前弱学习器的预测结果与之前的预测结果相加。

【树模型与集成学习】(task6)梯度提升树GBDT+LR

发现问题，并解决问题，批判性思维

11-03

782

学习总结（1）不同问题的提升树学习算法，主要区别在于使用的损失函数不同，如用平方误差损失函数的回归问题、用指数损失函数的分类问题、用一般损失函数的一般决策问题等。（2）由于GBDT是利用残差训练的，在预测的过程中，我们也需要把所有树的预测值加起来，得到最终的预测结果。【内容概要】Part D第一节和第二节【打卡内容】侧边栏练习，知识回顾，实现gbdt的分类树和回归树文章目录学习总结一、用于回归的GBDT1.1 函数空间的优化问题1.2 学习率1.3 另一个角度二、用于分类的GBDT2.1 拟合的

参与评论您还未登录，请先登录后发表或查看评论

【sklearn学习】集成算法之梯度提升树GBDT

qq_41807261的博客

04-06

2219

梯度提升树（Gradient Boosting Decision Tree, GBDT）是提升法中的代表算法 GBDT中包含Boosting三要素损失函数：用以衡量模型预测结果与真实结果的差异弱评估器：决策树，不同的boosting算法使用不同的建树流程综合集成结果：集成算法具体如何输出集成结果建模流程：依据上一个弱评估器的结果，计算损失函数，并使用损失函数自适应影响下一个弱评估器的构建。集成模型输出的结果，受到整体所有弱评估器的影响。 GBDT的不同弱评估器 GBDT的弱评

sklearn代码15 5-梯度提升树

weixin_44632711的博客

11-03

224

import numpy as np # f(x) = 3*x**2 # 梯度=导数 from sklearn.ensemble import GradientBoostingClassifier from sklearn import datasets from sklearn.model_selection import train_test_split X,y = datasets.load_iris(True) cond = y!=2 X = X[cond] y = y[cond] X_

梯度提升树算法原理小结

小白学视觉

06-16

1745

点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达本文转自|机器学习算法那些事前言本文介绍了boosting族的提升树算法和梯度提升（GBDT）算法...

集成学习之梯度提升树(GBDT)原理总结

qq_43468807的博客

05-16

456

一、GBDT概述 GBDT也是集成学习Boosting中的一种算法，但是却和传统的Adaboost有很大的不同。Adaboost 是利用前一轮迭代弱学习器的误差率来更新训练集的权重，这样一轮轮的迭代下去。GBDT也是迭代，但GBDT每一次的计算是都为了减少上一次的残差，进而在残差减少（负梯度）的方向上建立一个新的模型，其弱学习器限定了只能使用CART回归树模型，同时迭代思路和Adaboost也有所不同。 1.1、下面看个年龄预测的例子。简单起见，假定训练集只有4个人：A,B,C,D

（sklearn学习笔记）逻辑回归

weixin_48821464的博客

05-27

1588

听了菜菜的sklearn课程所做的学习笔记逻辑回归的基础一线性回归简介逻辑回归的基础一线性回归简介

machine learning学习笔记（二）-sklearn 库中常用算法的学习

AmberPro的博客

08-17

1068

sklearn常见算法简介 Logistic Regression Background Maximum Likelihood Logistic Function Normal Distribution Regularization Overfitting 算法将原本输出结果范围可以非常大的θTX 通过sigmoid函数映射到(0,1)，从而完成概率的估测。而直观地在二维空间理解逻辑...

机器学习知识点全面总结

最新发布

数字人生

04-13

1332

通过5个条件判定一件事情是否会发生，5个条件对这件事情是否发生的影响力不同，计算每个条件对这件事情发生的影响力多大，写一个梯度提升树（Gradient Boosting Trees）模型程序,最后打印5个条件分别的影响力。

机器学习Sklearn实战——极限森林、梯度提升树算法

Grateful_Dead424的博客

10-30

1215

极限森林 from sklearn.ensemble import ExtraTreesClassifier,RandomForestClassifier from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import cross_val_score from sklearn import datasets import numpy as np import matplotlib.pyplot as

Python机器学习(scikit-learn)：监督学习 --- 决策树、随机森林、梯度提升决策树

谢TS的博客

05-31

723

决策树是广泛用于分类和回归任务的模型。本质上它是从一层层 if/else 问题中进行学习并得出结论。集成(ensemble) 是合并多个机器学习模型来构建更强大模型的方法。决策树的主要缺点在于，即使做了预剪枝，它也经常会过拟合，泛化性能很差。因此，在大多数应用中，往往使用集成方法来替代单棵决策树。在机器学习文献中有许多模型都属于集成方法，大量实例已证明有两种集成模型对大量分类和回归的数据集都是有效的，二者都以决策树为基础，分别是随机森林(random forest) 和梯度提升决策树(gradient

git 指令

qq_25219151的博客

09-25

101

git 指令 git add . 添加文件到缓存 git status 查看状态 git commit -m 'remark' 提交至本地 -m 'remark' 提交的说明 git commit --no-verify -m "commit" 就可以跳过代码检查 git pull origin master 下载更新分支至本地 git push origin master 上传至远程 git merge origin/master

sklearn代码17 7-梯度提升分类树原理1

weixin_44632711的博客

11-04

186

import numpy as np from sklearn.ensemble import GradientBoostingClassifier import matplotlib.pyplot as plt %matplotlib inline from sklearn import tree xi = np.arange(1,11) yi = np.array([0,0,0,1,1,0,0,0,1,1]) gbdt = GradientBoostingClassifier(n_estim

梯度提升回归树

西小庄村高伟的博客

09-12

3842

sklearn中梯度提升树的应用

sklearn代码16 6-梯度提升树原理

weixin_44632711的博客

11-03

114

import numpy as np import matplotlib.pyplot as plt %matplotlib inline # 回归是分类的极限思想 # 分类的类别多到一定程度,就是回归 from sklearn.ensemble import GradientBoostingClassifier,GradientBoostingRegressor from sklearn import tree # X数据：上网时间和购物金额 # y目标:14 16, 24,26 X = np.

深入机器学习系列8-梯度提升树

Transwarp

09-06

2330

梯度提升树

梯度提升树的参数

weixin_60200880的博客

07-26

746

作为基于AdaBoost改进的Boosting算法，GBDT的功绩之一是将损失函数从有限的指数损失、MSE等推广到了任意可微函数，因此GBDT的损失函数选择异常丰富，因此我们可以在调参时加入损失函数作为需要调整的参数进行考量。在sklearn中，控制具体损失函数的参数为loss。GBDT中的损失函数因GBDT具体执行的预测任务而存在区别，同时也因标签的分布而存在区别。

决策树与提升树详解：原理、算法与优化

总结来说，这份笔记深入讲解了决策树的生成原理、特征选择策略、常见算法（如ID3、C4.5、CART和XGBoost），以及提升树的集成思想及其在实际应用中的优化技巧。通过理解和掌握这些内容，可以帮助学习者构建和优化高效...