目录
一、交叉验证
1.回归问题的验证
把获取的全部训练数据分成两份:一份用于测试,一份用于训练。然后用前者来评估模型。假如有10 个训练数据,大多数情况会采用3 : 7 或者2 : 8 这种训练数据比例。假如我们用3 个用于测试、7 个用于训练。关于点击量预测的回归问题,我们现在有10 个数据,其中测试数据和训练数据是这样分配的。
若用表示目标函数,较理想的状态如下图所示:
目录
把获取的全部训练数据分成两份:一份用于测试,一份用于训练。然后用前者来评估模型。假如有10 个训练数据,大多数情况会采用3 : 7 或者2 : 8 这种训练数据比例。假如我们用3 个用于测试、7 个用于训练。关于点击量预测的回归问题,我们现在有10 个数据,其中测试数据和训练数据是这样分配的。
若用表示目标函数,较理想的状态如下图所示: