交叉验证、网格搜索使用数据:

最新推荐文章于 2024-07-12 19:30:19 发布

烤羊的锅

最新推荐文章于 2024-07-12 19:30:19 发布

阅读量194

点赞数 3

文章标签： python

本文链接：https://blog.csdn.net/weixin_58074451/article/details/136451221

版权

网格搜索交叉验证(Grid Search Cross-Validation)调优过程中的数据使用机制可以分为两个阶段：参数选择和模型训练。

参数选择阶段：在这个阶段，目的是找到最优的参数组合。这里使用的是全部数据，但通过交叉验证的方式将数据分为多个训练集和验证集的组合。对于每一组参数，模型会在每个训练集上进行训练，并在对应的验证集上进行评估。这样可以确保模型对未见数据的泛化能力。在这个阶段，并不是直接在全部数据上训练模型，而是在不同的训练集-验证集划分上重复训练和评估，以确定最佳参数。
最终模型训练阶段：找到最优参数组合后，有两种做法。一种是使用这组最优参数在全部数据集上重新训练模型，以充分利用所有可用数据；另一种是仅使用找到的最优参数，但保持模型只在原来的训练集上训练，不使用全部数据。实际操作中，哪种方式更优可能取决于具体场景和数据集的特性。

综上所述，网格搜索交叉验证调优时，在参数选择阶段通过交叉验证在不同的训练集上进行训练，并不直接在全部数据上训练。但在确定了最佳参数后，可以选择在全部数据上重新训练模型，以期望获得更好的模型性能。

关注