网格搜索最佳参数GridSearchCV
class sklearn.model_selection.
GridSearchCV
(estimator, param_grid, scoring=None, fit_params=None, n_jobs=1,iid=True, refit=True, cv=None, verbose=0, pre_dispatch='2*n_jobs', error_score='raise',return_train_score=True)
对分类器的指定参数值进行详尽搜索
重要的成员是fit和predict
分类器的参数通过参数网格上的交叉验证网格搜索进行优化
参数: |
|
---|
scikit-learn分类器接口,估计者需要提供分数函数。如estimator = GradientBoostingClassifier(参数设置)
2.param_grid : dict or list of dictionaries
具有参数名称(字符串)作为键的字典和要实数值的参数设置的列表,或者这些字典的列表,在这种情况下,会探索列表中每个字典跨越的网格。 这样可以根据任何参数设置的顺序进行最优参数的搜索。
如param_test = {'n_estimators':range(20,81,10)}
param_dist = {
"max_depth": [3, None],
"max_features": [1,5,7,11],
"min_samples_split": [1,5,7,11],
"min_samples_leaf": [1,5,7,11],
"bootstrap": [True, False],
"criterion": ["gini", "entropy"]}
3.scoring : string, callable or None, default=None
字符串(见模型评估文档)或具有签名记分器(estimator,X,y)的可调用对象/函数。 如果没有,则使用估计器的分数法
如scoring='roc_auc'
4.fit_params : dict, optional