XGBOOST学习曲线及改进，泛化误差

最新推荐文章于 2024-07-10 09:14:14 发布

weixin_45271076

最新推荐文章于 2024-07-10 09:14:14 发布

阅读量2.7k

点赞数 5

本文链接：https://blog.csdn.net/weixin_45271076/article/details/117248827

版权

from xgboost import XGBRegressor as XGBR
from sklearn.ensemble import RandomForestRegressor as RFR
from sklearn.linear_model import LinearRegression as LR
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split,cross_val_score as CV,KFold
from sklearn.metrics import mean_squared_error as MSE
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from time import time
import datetime

data=load_boston()
X=data.data
y=data.target

Xtrain,Xtest,ytrain,ytest=train_test_split(X,y,test_size=0.3,random_state=420)
reg=XGBR(n_estimators=100).fit(Xtrain,ytrain)

reg.predict(Xtest)
reg.score(Xtest,ytest)#返回的是R平方
MSE(ytest,reg.predict(Xtest))
reg.feature_importances_
#查看SKLEARN中所有的模型评估指标
import sklearn
sorted(sklearn.metrics.SCORERS.keys())

#交叉验证，与线性回归随机森林进行结果比对
reg=XGBR(n_estimators=100)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_45271076

关注关注

5
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

R语言机器学习算法实战系列（一）XGBoost算法+SHAP值（eXtreme Gradient Boosting）

专注生信领域

09-13

1070

R语言机器学习算法实战系列（一）：XGBoost算法（eXtreme Gradient Boosting）

机器学习分类算法之XGBoost（集成学习算法）

热门推荐

迷茫与徘徊只会让你陷入绝境，欢迎私信博主，带你开始提升变现价值！

02-14

8万+

目录走进XGBoost 什么是XGBoost？ XGBoost树的定义 XGBoost核心算法正则项：树的复杂程度 XGBoost与GBDT有什么不同 XGBoost需要注意的点 XGBoost重要参数详解调参步骤及思想 XGBoost代码案例相关性分析 n_estimators（学习曲线） max_depth（学习曲线）调整max_depth 和min_child_weight 调整gamma 调整subsample 和colsample_bytree 调整正则

参与评论您还未登录，请先登录后发表或查看评论

xgboost 查看 学习曲线

weixin_37198422的博客

03-29

706

1.首先升级xgboost的版本我的是1.5.2 查看版本代码: import xgboost xgboost.__version__ 2.其次查看可以使用的metric:https://xgboost.readthedocs.io/en/latest/parameter.html#learning-task-parametershttps://xgboost.readthedocs.io/en/latest/parameter.html#learning-task-parameters

Python 中解释 XGBoost 模型的学习曲线

Python中文社区

06-13

4479

XGBoost是梯度提升集成算法的强大而有效的实现。配置XGBoost模型的超参数可能具有挑战性，这通常会导致使用既费时又计算量大的大型网格搜索实验。配置XGBoost模型的另一种方法是在...

模型优化_XGBOOST学习曲线及改进，泛化误差

惊鸿一博

02-29

732

n_estimators的极限已达到，我们才考虑其他参数，但XGB中的状况明显更加复杂，当数据集不太寻常的时候会更加。了，即便只有很少的数据，模型也能够学到训练数据100%的信息，所以XGB也是天生过拟合的模型。首先，XGB中的树的数量决定了模型的学习能力，树的数量越多，模型的学习能力越强。第二，XGB中树的数量很少的时候，对模型的影响较大，当树的数量已经很多的时候，对模型的影响比较小，只能有。第三，树的数量提升对模型的影响有极限，最开始，模型的表现会随着XGB的树的数量一起提升，但到达某个点之。

通过学习曲线调整XGBoost性能

Together_CZ的博客

03-30

2839

【翻译自： Tune XGBoost Performance With Learning Curves】【说明：Jason BrownleePhD大神的文章个人很喜欢，所以闲暇时间里会做一点翻译和学习实践的工作，这里是相应工作的实践记录，希望能帮到有需要的人！】 XGBoost是梯度提升集成算法的强大而有效的实现。配置XGBoost模型的超参数可能具有挑战性，这通常会导致使用既费时又计算量大的大型网格搜索实验。配置XGBoost模型的另一种方法是在训练...

xgboost使用train方法训练模型绘制学习曲线的方法

weixin_43453750的博客

08-24

3950

使用train方法训练模型后，无法使用fit方法的bst.evals_result()，报错如下： 'Booster' object has no attribute 'evals_result' 采用以下方法： immport xgboost as xgb param={...} xg_train = xgb.DMatrix(x_train, label=y_train) xg_test = xgb.DMatrix(x_test, label=y_test) evals_result = {}

ML之xgboost：利用xgboost算法(sklearn+3Split+调参曲线)训练mushroom蘑菇数据集(22+1,6513+1611)来预测蘑菇是否毒性(二分类预测)

近期请国内外头部出版社可尽快私信博主！——心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，谦虚，自律，反思，成长，还算是比较正能量的博主，公益免费传播……内心特别想在AI界做出一些可以推进历史进程影响力的东西(兴趣使然，有点小情怀，也有点使命感呀)…

05-24

7948

ML之xgboost：利用xgboost算法(sklearn+3Split+调参曲线)训练mushroom蘑菇数据集(22+1,6513+1611)来预测蘑菇是否毒性(二分类预测) 目录利用xgboost算法(sklearn+3Split+调参曲线)训练mushroom蘑菇数据集(22+1,6513+1611)来预测蘑菇是否毒性(二分类预测) 利用xgboost算法(sklearn+3Split)训练mushroom蘑菇数据集(22+1,6513+1611)来预测蘑菇是否毒性(二分类预测

XGBoost 学习曲线方法寻优

最新发布

10-08

XGBoost是一款高效的梯度 boosting 框架，它的学习曲线方法寻优主要是为了找到最佳的超参数配置，以最大化模型性能。以下是使用学习曲线来进行XGBoost模型调优的一般步骤： 1. **划分数据**：首先，将数据划分为...

R语言xgboost模型构建分类模型实战：构建Xgboost模型并绘制ROC曲线

statistics+insight+vista+power

07-10

251

R语言xgboost模型构建分类模型实战：构建Xgboost模型并绘制ROC曲线

XGBoost的改进----Lightgbm

Rudy95的博客

08-23

4113

Lightgbm改进的点：基于Histogram的决策树算法带深度限制的Leaf-wise的叶子生长策略直方图做差加速直接支持类别特征(Categorical Feature) Cache命中率优化基于直方图的稀疏特征优化多线程优化下面主要介绍Histogram（直方图）做差加速、带深度限制的Leaf-wise的叶子生长策略。基于histogram的决策树算法直方图算法的基本思...

sklearn_xgb:用于 xgboost 的改进的 scikit-learn 界面

06-02

改进的 XGBoost 类似 scikit-learn 的界面关于 scikit-learn 是 Python 的机器学习库。 XGBoost 是一个新的有用的梯度提升库，它提供了一个定制的 Python 界面以及一个简化的 scikit-learn-like 界面。这个 repo 包含一个稍微改进和定制的 XGBoost 类似 scikit-learn 的界面，主要基于官方代码，并进行了一些小的修改。安装安装 scikit-learn 和 xgboost，下载这个 repo 并将其放入你的项目中。执照此 repo 中的代码遵循 Apache 许可证版本 2.0。 scikit-learn 遵循新的 BSD 许可证。 XGBoost 遵循 Apache 许可版本 2.0。参考 [1] Scikit-learn：Python 中的机器学习，Pedregosa 等人，JM

梯度提升决策树GBDT及其优秀改进XGBoost的浅析

八门金锁的技术博客

12-18

1485

梯度提升决策树英文是Gradient Boosting Decision Tree (GBDT)。是一种迭代的决策树算法，由多棵决策树组成，将所有树的结论累加起来做最终答案。值得注意的是，GBDT中的树都是回归树，不是分类树。GBDT主要用于回归问题（包括线性和非线性），但也可以用于分类问题。我们在已经搞清楚决策树(DT)部分的前提下，可以简单看看梯度迭代(GB)。GB核心的思想就是每一棵树都在学习之前所有树结论和的残差。输入训练集数据D={(xi,yi)}i=1ND = \{(x_i,y_i)\}

麻雀算法优化XGBoost用于故障数据分类

JizhPhp的博客

09-21

故障数据分类是一种重要的任务，它可以帮助我们识别和预测设备或系统中可能出现的故障。麻雀算法是一种基于群体智能的优化算法，它模拟了麻雀在觅食过程中的行为，具有全局搜索和局部优化的能力。以上是基于麻雀算法优化的XGBoost故障数据分类的详细步骤和MATLAB源代码实现。本文将介绍如何使用MATLAB实现基于麻雀算法优化的XGBoost故障数据分类，并提供相应的源代码。使用最佳个体对故障数据进行分类。根据麻雀算法的探索和利用行为，选择适应度较高的个体进行保留，并根据麻雀算法的规则生成新的个体，以更新当前种群。

使用R构建Xgboost模型并绘制ROC曲线

data+scenario+science+insight

07-07

2133

使用R构建Xgboost模型并绘制ROC曲线 # xgboost by R install.packages("Ckmeans.1d.dp") install.packages('xgboost') install.packages('Matrix') url <- 'https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv' redwine <- read...

机器学习之XGBoost模型学习

老赵的博客

01-09

814

python

绘制学习曲线代码

点西西的博客

07-25

442

from sklearn.svm import LinearSVC from sklearn.learning_curve import learning_curve #绘制学习曲线，以确定模型的状况 def plot_learning_curve(estimator, title, X, y, ylim=None, cv=None, train_sizes=np.linspace(.1, 1.0, 5)): """ 画出data在某模型上的l

机器学习的学习曲线

tinstone的博客

03-08

3930

通常模型调参可通过网格搜索的方式进行搜索实验，但是另一种方法是在训练期间评估模型在每次迭代的模型性能，并将结果绘制成图，则该图即为学习曲线。学习曲线提供了一种模型诊断工具，可以解释并建议对模型超参数进行特定更改，从而可能会提高预测性能，通常学习曲线是在 x 轴上显示时间或经验，在 y 轴上显示学习或改进的评估指标值，从而更加了解模型 “学习” 的程度。欠拟合过拟合良好拟合。