关于深度学习样本的独立同分布的通俗解释

研究目标检测算法时,研究人员通常都会假设训练集和测试集是独立同分布的,即所有的图像数据都采集于同一分布并且相互独立。当训练集和测试集来源于同一数据集时,这样的假设通常会成立。

这里的数据分布,主要分为两种,第一种是边缘分布,指的是产生数据的分布,其分布不同是表明数据的产生的机制不同,比如说,不同的主题的文本特征。另外一种分布是条件分布,指的是数据和标签之间的后验概率分布。条件分布不同指的是,即使数据是来自于同一边缘分布,但是其具体的下游数据任务不同,如分类任务和回归任务的不同,也会导致条件分布不同。

然而,当算法部署到现实环境时,由于一些光照、背景、图像质量、拍摄角度等原因,现实环境中获取的图像数据与训练算法使用的训练集图像往往不满足独立同分布的假设。这个属于产生的机制不同,边缘分布不同。此时目标检测算法的性能可能因为模型训练使用图像和实际应用获取图像间的差异而急剧下降。


 

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

炸那个炸

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值