- 验证集是为了验证哪个算法更加高效,选出最好的模型;
- 测试集是为了正确评估模型的性能,
- 在数据量很小的情况下,可以按照60/20/20的比例为训练集,验证集,测试集进行分配
- 在数据量很大的情况下,如百万数据时,比例分配会发生变化,dev和test各给10000个数据就可以,因为验证哪个算法好,顶多不超过10个算法,并且希望尽快验证出好坏,不宜过多数据
- dev set 和 test set 一定要是从同一分布中的得来的数据
深度学习笔记-训练集,验证集,测试集
最新推荐文章于 2023-07-04 22:19:26 发布