深度学习中训练集需要数据增强,验证集和测试集不需要做数据增强

问题:深度学习中训练集需要数据增强,验证集和测试集不需要做数据增强,但是如果我的数据(小数据集1000个样本)按照700:300比例分配了训练集和验证集,再对700个训练集的样本进行数据增强(比如增强到2400张图片),训练集和验证集的比例2400:300这样分配合理吗,还是就应该这样分呢,不是要保证一定的比例吗,谢谢。

回答:1、验证集和测试集不需要扩充,数据扩充指针对训练集。

           2、比例指的是对原始数据划分的比例,不考虑增强后的。

           3、首先要明白做数据增强的意义,是为了利用现有训练集的数据,通过增强变换获得更丰富的信息,从而在测试集(验证机)上获得更好的泛化能力;

           4、如果先做增强再进行数据集的划分,那么会出现信息泄露的问题,导致同一张图片增强后的多张图片分别出现在训练集和测试集(验证集),那么由于在训练集里见过相似度很高的图片,测试(验证)的准确率就会很高,这时的测试准确率结果是不可靠的。

  • 20
    点赞
  • 61
    收藏
    觉得还不错? 一键收藏
  • 11
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值