对于同一组测试集,使用两个不同的seed进行两次实验,这两次实验的训练集都更大,但是一次实验结果是测试集精度上升,另外一次实验结果是测试集精度下降。两组实验虽然训练集都更大,但是都不是对于小数据集的扩展,而是重新随机采样了更大的数据集。不过这两次实验的训练集是相同的。
这个现象很有意思。更大的训练集使得测试集精度上升比较好理解,但是为什么更大的训练集也会造成测试集精度下降呢?也许是因为更大的训练集包含了更多与测试集不同的分布。
对于同一组测试集,使用两个不同的seed进行两次实验,这两次实验的训练集都更大,但是一次实验结果是测试集精度上升,另外一次实验结果是测试集精度下降。两组实验虽然训练集都更大,但是都不是对于小数据集的扩展,而是重新随机采样了更大的数据集。不过这两次实验的训练集是相同的。
这个现象很有意思。更大的训练集使得测试集精度上升比较好理解,但是为什么更大的训练集也会造成测试集精度下降呢?也许是因为更大的训练集包含了更多与测试集不同的分布。