1. 交叉验证
目的: 为了让被评估的模型更加准确可靠
过程:
训练: 训练集 + 验证集
1,2,3 4
1,2,4 3
2. 超参数网格搜索:
调整参数会影响到模型的准确度, 为了得到最优的模型, 可以提前预设几组参数
api:
from sklearn.model_selection import GridSearchCV
初始化方法:
estimator: 估计器
param_grid:
{
"n_neighbors": [1, 3, 5, 7, 9]
}
cv: 交叉验证
方法:
fit(): 拟合数据
属性:
bestscore:在交叉验证中验证的最好结果_
bestestimator:最好的参数模型
cvresults:每次交叉验证后的验证集准确率结果和训练集准确率结果