sklearn-GridSearchCV调节超参数
同样的模型不同的参数下,模型的得分差距很大。sklearn中提供了参数调节函数:GridSearchCV。将待挑选的参数输入,可以自动的挑选最佳的参数和结果。
缺陷: 一旦模型的量级上去之后,将需要很长的时间函数才能运行完成。因为该函数执行一次所训练和测试的次数为:优化参数组合数*K(K折交叉验证)。当数据集很大时,多次反复训练模型将非常耗时。
对于数据集很大时可以参考这篇博客:一种将grid-search速度提升10倍的方法
关于交叉验证可以参考这篇博客:交叉验证
- 函数原型
class sklearn.model_selection.GridSearchCV(
estimator,
param_grid,
scoring=None,
fit_params=None<