
模型选择与调优
一个Fold被用作验证集,其余的K-1个Fold被用作训练集。该技术重复K次,直到每个Fold都被用作验证集,其余的作为训练集。K-折交叉验证的变种, 分层的意思是说在每一折中都保持着原始数据中各个类别的比例关系,比如说:原始数据有3类,比例为1:2:1,采用3折分层交叉验证,那么划分的3折中,每一折中的数据类别保持着1:2:1的比例,这样的验证结果更加可信。比如在KNN算法中,k是一个可以人为设置的参数,所以就是一个超参数。说明:普通K折交叉验证和分层K折交叉验证的使用代码是一样的 只是引入的类不同。











