def cv(params, dtrain, num_boost_round=10, nfold=3, stratified=False, folds=None,
metrics=(), obj=None, feval=None, maximize=False, early_stopping_rounds=None,
fpreproc=None, as_pandas=True, verbose_eval=None, show_stdv=True,
seed=0, callbacks=None, shuffle=True)
xgb_param 可以用xgb.XGBClassifier().get_xgb_params()获得
dtrain则是用xgb.DMatrix(x_train,y_train)获得。
num_boost_round是最大迭代次数,
early_stopping_rounds,测试集50 round没有提升迭代停止,输出最好的轮数,
verbose_eval=10意思是每10轮打印一次评价指标,
show_stdv=Flase表示不打印交叉验证的标准差。
nfold表示几折
folds可以接受一个KFold或者StratifiedKFold对象
metrics是一个字符串或者列表,表示评价指标,一般都用‘auc’
另外xgb.cv返回的是一个datafram
其他参数我就不写了。