深度学习中训练集需要数据增强，验证集和测试集不需要做数据增强

最新推荐文章于 2024-01-18 16:54:37 发布

小ccccc

最新推荐文章于 2024-01-18 16:54:37 发布

阅读量4.5k

点赞数 20

文章标签：深度学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/w18013886857/article/details/130092705

版权

问题：深度学习中训练集需要数据增强，验证集和测试集不需要做数据增强，但是如果我的数据（小数据集1000个样本）按照700：300比例分配了训练集和验证集，再对700个训练集的样本进行数据增强（比如增强到2400张图片），训练集和验证集的比例2400：300这样分配合理吗，还是就应该这样分呢，不是要保证一定的比例吗，谢谢。

回答：1、验证集和测试集不需要扩充，数据扩充指针对训练集。

2、比例指的是对原始数据划分的比例，不考虑增强后的。

3、首先要明白做数据增强的意义，是为了利用现有训练集的数据，通过增强变换获得更丰富的信息，从而在测试集（验证机）上获得更好的泛化能力；

4、如果先做增强再进行数据集的划分，那么会出现信息泄露的问题，导致同一张图片增强后的多张图片分别出现在训练集和测试集（验证集），那么由于在训练集里见过相似度很高的图片，测试（验证）的准确率就会很高，这时的测试准确率结果是不可靠的。

关注

20
点赞
踩
61

收藏

觉得还不错? 一键收藏
11
评论
深度学习中训练集需要数据增强，验证集和测试集不需要做数据增强

3、首先要明白做数据增强的意义，是为了利用现有训练集的数据，通过增强变换获得更丰富的信息，从而在测试集（验证机）上获得更好的泛化能力；2、比例指的是对原始数据划分的比例，不考虑增强后的。
复制链接

扫一扫

小ccccc CSDN认证博客专家 CSDN认证企业博客

码龄6年

16: 原创

42万+: 周排名

20万+: 总排名

2万+: 访问

: 等级

280: 积分

9: 粉丝

47: 获赞

16: 评论

130: 收藏

私信

关注

热门文章

最新评论

深度学习中训练集需要数据增强，验证集和测试集不需要做数据增强
2301_80422860: 博主你好，如果我使用随机贴图的方式将已标注的目标抠出来随机贴在我的数据集图片中（同一张抠图可能会出现在不同图片上）（就是目标的背景会不一样），然后再划分训练集和验证集，这样会导致验证的结果虚高吗
深度学习中训练集需要数据增强，验证集和测试集不需要做数据增强
俺很酷！: 一开始把数据分为训练集和测试集，这时候训练集和测试集是可以保证同分布的，但如果数据增强手段不符合实际情况，破坏了原训练集分布，这时测试集准确率反而会下降。数据增强的本质是人工提供先验知识，可以多尝试几种增强手段。测试集如答主一样，不要变动。
深度学习中训练集需要数据增强，验证集和测试集不需要做数据增强
小ccccc: 保持不变
深度学习中训练集需要数据增强，验证集和测试集不需要做数据增强
萌萌呆呆鼠: 博主，请问，假如我将训练集增强后，测试集是保持不变的。那么得到的训练集的数量增加了，那么此时我的验证集是保持不变还是需要将增强后得到的新训练集的一部分作为验证集？
HOW DO VISION TRANSFORMERS WORK 总结
CSDN-Ada助手: 恭喜您写了第19篇博客！看了您的总结文章，对Vision Transformers的工作原理有了更深入的了解。建议您在下一步的创作中，可以尝试加入一些实际案例或者应用场景，以及对比不同方法的优缺点，这样可以使读者更加直观地理解和接受您的观点。希望您继续保持创作的热情，期待您更多精彩的文章！

大家在看

全网最适合入门的面向对象编程教程：02 类和对象的Python实现-使用Python创建类

最新文章

目录

评论 11

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。