交叉验证与网格搜索
1、交叉验证
1.定义:
将拿到的训练数据,分为训练和验证集
N折交叉验证
2.分割方式:
训练集:训练集+验证集
测试集:测试集
3.为什么需要交叉验证
为了让被评估的模型更加准确可信
注意:交叉验证不能提高模型的准确率
2、网格搜索
超参数:
sklearn中,需要手动指定的参数,叫做超参数
网格搜索就是把这些超参数的值,通过字典的形式传递进去,然后进行选择最优值
3、API
estimator = GridSearchCV(estimator, param_grid=param_grid, cv=10, n_jobs=-1)
estimator — 选择了哪个训练模型
param_grid — 需要传递的超参数
cv — 几折交叉验证