XGBoost（extreme gradient boosting）的使用例子

最新推荐文章于 2024-01-21 09:29:07 发布

supreme_1

最新推荐文章于 2024-01-21 09:29:07 发布

阅读量1.3k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/supreme_1/article/details/104376204

版权

XGBoost是一种梯度提升模型，在结构化数据中表现出色。通过迭代过程，不断优化损失函数并添加新模型，以提高预测准确性。文章提供了一个使用XGBoost库的实例，解释了关键参数如n_estimators、early_stopping_rounds和learning_rate的作用，并指出合理的参数设置对于防止过拟合和提高效率的重要性。

摘要由CSDN通过智能技术生成

梯度提升模型（gradient boosting）：它是目前在结构化数据中表现最好的模型。和随机森林类似，都是集成学习的方法。随机森林是将多个决策树的预测值取平均。梯度提升梯度是一种通过循环迭代将模型添加到集合中集成的方法。它首先用单个模型初始化集合，其预测可能非常稚拙的。(即使它的预测非常不准确，随后对集合的添加也会解决这些错误。)
迭代过程：
首先，我们使用当前模型集合为数据集中的每个观测生成预测。为了进行预测，我们将集合中所有模型的预测相加。
用这些预测计算损失函数(例如，均方误差)。
然后我们用损失函数来拟合一个新模型，确定这个模型的参数，使这个模型集成到集合中能带来损失的下降。（梯度提升中的‘梯度’指我们对损失函数使用梯度下降以确定新模型中的参数。）
最后将这个模型集成到集合中。
重复以上步骤。

例子：

在本例中，您将使用XGBoost库。XGBoost代表极端梯度增强，它是梯度增强的一种实现，它的几个附加特性侧重于性能和速度。(Scikit-Learning有另一个版本的梯度增强，但XGBoost有一些技术优势。)

假设我们已经导入了训练数据和验证数据：X_train, X_valid, y_train, and y_valid.。

from xgboost import XGBRegressor

my_model = XGBRegressor()
my_model.fit(X_train, y_train)

进行预测:

from sklearn.metrics import mean_absolute_error

predictions

最低0.47元/天解锁文章

supreme_1

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录