图像数据集分布的理解

图像数据分布在深度学习,计算机视觉中经常会看到,并且会有这么一句话:“要求测试集和训练集的的数据分布是相同的”。那么数据集分布到底是什么?是如何进行分布的呢?如果说两个图像服从同一分布,到底是什么意思呢?

首先我们需要先了解到一张图片可以通过其像素值表示出来,例如一张256*256的灰度图可以通过65536维的向量,每个维度值的范围是0-255,来表示出来。

想象一下,如果这个向量服从均匀分布的话,他会是什么样子呢。如果我们将这样一种随机采样得到的向量解释为图像的话,我们看到一张人脸的可能性极其渺茫,实际上能看到的是一张充满噪声的图像。

 为什么你知道看到的不是一张人脸呢?因为你知道一张脸不是由均匀分布的像素组成,而是有另外的一种分布。

因此,两个图像服从同一分布,其实就是将它们转化为向量后,该向量服从某一种分布。直觉上你自然知道mnist和mnist-m分布不同,但是其内部图像服从同一分布。

对于样本空间的分布我们以二维空间为例,我们认为该样本空间的分布就是随机变量X和Y的联合概率分布。而X和Y呢,分别代表二维空间的维度,X和Y代表所有数据的第一维度和第二维度。

因此,对于高维空间来说,我们认为是所有维度的联合概率分布,就是该样本空间或者说是数据集的分布情况了。

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值