GroupKFold是KFold一个变体,目的在于将groups严格分开,以减少过拟合现象。
它如何work的呢?
看下图,group参数是通过不同的group标识符(用颜色来区分),使得训练集和测试集在划分时不会跨group的范围。不会overlap。
比如以下代码。表明有三个组,即三个不同颜色划分。
>>> groups = [1, 1, 1, 2, 2, 2, 3, 3
GroupKFold是KFold一个变体,目的在于将groups严格分开,以减少过拟合现象。
它如何work的呢?
看下图,group参数是通过不同的group标识符(用颜色来区分),使得训练集和测试集在划分时不会跨group的范围。不会overlap。
比如以下代码。表明有三个组,即三个不同颜色划分。
>>> groups = [1, 1, 1, 2, 2, 2, 3, 3