当使用五重交叉验证时,基本上训练了五个独立的模型,每个模型都在不同的数据子集上。基于该特定褶皱的训练数据独立地确定每个模型的参数。
完成交叉验证过程后,您可以选择几个选项来确定最终模型的参数:
1.**使用最佳折叠重新训练**:您可以选择从验证折叠表现最好的模型中提取参数,并使用这些参数在整个数据集上重新训练最终模型。这种方法假设性能最好的折叠将找到最通用的参数。
2.**平均参数**:对五个模型的参数进行平均并不是一种常见的做法,因为模型参数并不总是直接可比的,对它们进行平均并不一定会得到性能更好甚至更好的模型。
3.**超参数选择**:更常见的是,交叉验证用于超参数调整。您可以使用交叉验证的结果来选择最佳超参数,而不是任何单个模型的特定参数。一旦选择了最佳超参数,就可以使用这些超参数在整个训练数据集上训练最终模型。
4.**集合方法**:另一种选择是将所有五个模型用作集合,用所有模型进行预测,然后对预测进行平均或使用多数投票方案。这通常比任何单个模型都能产生更好的性能,因为它受益于在不同数据子集上训练的模型的多样性。
因此,总的来说,最终的模型通常不是来自五个折叠的参数的直接平均值。它要么在具有最佳性能超参数的整个数据集上进行再训练,要么使用集成方法来组合所有模型的预测能力。
10-15
“相关推荐”对你有帮助么?
-
非常没帮助
-
没帮助
-
一般
-
有帮助
-
非常有帮助
提交