训练集 验证集_训练与验证、测试集数据分布不同的情况

本文探讨了在深度学习中遇到的训练集、验证集与测试集数据分布不一致的情况,分析了这种差异可能导致的偏差与方差问题,并提出了相应的处理策略。参考了吴恩达的深度学习课程内容。
摘要由CSDN通过智能技术生成

3c4d376fff809a2de455fdb16edd63d5.png在不同分布的数据集上进行训练与验证、测试

深度学习需要大量的数据,但是有时我们可获得的满足我们真实需求分布的数据并不是那么多,不足以对我们的模型进行训练。这时我们就会收集大量相关的数据加入到训练集中,即使有些数据,甚至是大部分数据的分布都与验证集、测试集的数据分布不同。 我们以一个例子理解一下为什么我们会这么做:

cde26f11a999c449dae9e6fbf63a9465.png

依旧假设我们在建设一个猫分类网站,我们有两种,一种是我们目标分布,也就是我们用户上传的,不是那么专业的,甚至还有些比较模糊的猫图片;一种是我们网络上爬取的清晰的,专业的猫图片。这两种数据分布明显不同,但是问题是,我们从用户那里获取到的训练数据是有限的,只有10000 个左右,而这并不足以对我们的模型进行足够好的训练,训练集较少还容易发生过拟合;我们能从网络中爬取到的图片有200000 份,这个数量足以对我们的模型进行训练。 那么我们该如何做,使用我们从用户中仅能获取的10000 个数据,将我们的模型训练得足够好呢?
  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值