吴恩达老师的视频中,如果当数据量不是很大的时候(万级别以下)的时候将训练集、验证集以及测试集划分为6:2:2;若是数据很大,可以将训练集、验证集、测试集比例调整为98:1:1;但是当可用的数据很少的情况下也可以使用一些高级的方法,比如留出方,K折交叉验证等。
- 当数据量不大的时候,也就是万级别或者以下的时候,则划为6:2:2,这样划分就可以了;
- 当数据量特别大的时候,大数据,还按6:2:2划分验证集和测试集的话,可能得到的验证集和测试集数量非常大,我们肯定想着拿去训练的样本越多越好,这个时候按98:1:1就好了,举得例子就是100万条样本,1万条做验证,1万条做测试,网络就能够很好的工作;