xgboost调用sklearn的交叉验证，并且使用自定义的训练集、验证集进行模型的调参

最新推荐文章于 2022-04-20 12:01:58 发布

AndrewHR

最新推荐文章于 2022-04-20 12:01:58 发布

阅读量1.1w

点赞数 2

分类专栏：机器学习工程实践数据挖掘、推荐、广告文章标签： sklearn 自定义验证集交叉验证 xgboost参数调网格搜索

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gangyin5071/article/details/78560228

版权

本文介绍了如何在sklearn的GridSearchCV中使用自定义验证集进行XGBoost模型的参数调优。通过PredefinedSplit类实现非随机分割的验证集，确保验证集和测试集同分布，从而提升模型性能。

摘要由CSDN通过智能技术生成

一、概述

如果你的预测模型表现得有些不尽如人意，那就用XGBoost吧。XGBoost算法现在已经成为很多数据工程师的重要武器。它是一种十分精致的算法，可以处理各种不规则的数据。构造一个使用XGBoost的模型十分简单。但是，提高这个模型的表现就有些困难(至少我觉得十分纠结)。这个算法使用了好几个参数。所以为了提高模型的表现，参数的调整十分必要。在解决实际问题的时候，有些问题是很难回答的——你需要调整哪些参数？这些参数要调到什么值，才能达到理想的输出？

有人会说，这个简单哇，直接使用sklearn集成的交叉验证，比如：gridsearchCV等

但是这样我们往往碰见一个问题，就是这个方法自定义的验证集是从你给出的训练集随机分割的，在合理一点就是按照label等比例分割，保证训练集和测试集的label分布一致。但是有时候我们的测试集分割方式可能是按照时间分出来的（特别是在各种机器学习竞赛上），这时候我们为了尽量保证验证集和测试集同分布，也应该使用时间分割，这个时候怎么使用自定义的验证集去调参的问题就摆在了我们面前

话不多说，直接进入正题，实例代码加讲解告诉各位怎么做

二、在gridsearchCV上使用自定义验证集

（1）首先我们要先了解一个sklearn的类

就是下面这个类：

class sklearn.

最低0.47元/天解锁文章

关注

2
点赞
踩
23

收藏

觉得还不错? 一键收藏
3
评论
xgboost调用sklearn的交叉验证，并且使用自定义的训练集、验证集进行模型的调参

一、概述如果你的预测模型表现得有些不尽如人意，那就用XGBoost吧。XGBoost算法现在已经成为很多数据工程师的重要武器。它是一种十分精致的算法，可以处理各种不规则的数据。构造一个使用XGBoost的模型十分简单。但是，提高这个模型的表现就有些困难(至少我觉得十分纠结)。这个算法使用了好几个参数。所以为了提高模型的表现，参数的调整十分必要。在解决实际问题的时候，有些问题是很难回答的——你需要
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。