每天看一遍,学习永不厌 交叉验证 由于数据集的划分有不确定性,若随机划分的样本正好处于某类特殊样本,则得到的训练模型所预测的结果的可信度将受到质疑。所以需要进行多次交叉验证,把样本空间中的所有样本均分成n份,使用不同的训练集训练模型,对不同的测试集进行测试时输出指标得分。 分类业务对数据不能随意打乱拆分。 sklearn提供了交叉验证相关API: cv=折叠数,交叉验证次数。scoring='accuracy’指标还可以是查全查准,F1 import sklearn.model_selection as ms ms.cross_val_score(模