深度学习理论——数据预处理(逐样本减去均值)

大家好,继续深度学习的理论日记,本次介绍数据预处理相关内容。

在深度学习中,大家都会发现训练集,验证集合测试集划分好之后会有减去均值的一步操作,但很多人都是只跟着做,并没有探究为什么要做这一步处理。

其主要原理是我们默认自然图像是一类平稳的数据分布(即数据每一维的统计都服从相同分布),此时,在每个样本上减去数据的统计平均值可以移除共同的部分,凸显个体差异。其效果如下所示:


可以看到天空的纹理被移除了,凸显了汽车和高楼等主要特征。

最值得注意的一点是,在计算均值之前就要预先划分好训练集验证集和测试集,然后只针对训练集计算均值,否则就违背了深度学习的原则:模型训练过程仅能从训练模型中获取信息。得到训练集的均值后,对训练集验证集和测试集分别减去该均值。


  • 9
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
深度学习图形数据预处理通常包括以下步骤: 1. 数据读取:首先,从数据源(如硬盘、数据库等)中读取图形数据。这可能涉及到加载图像文件、解析标签等操作。 2. 数据清洗和归一化:对原始图像数据进行清洗和归一化,以消除噪声、异常值或不必要的信息。这可能涉及到去除图像中的水印、纠正图像的旋转、裁剪图像等操作。 3. 图像增强:为了增加训练数据的多样性和鲁棒性,可以对图像进行增强处理。常见的增强技术包括调整亮度、对比度、饱和度,加入随机噪声,进行图像翻转、旋转、缩放等。 4. 图像标准化:将图像数据标准化到一定的范围内,以便于神经网络的训练。这可以通过减去均值、除以标准差等方法来实现。 5. 图像尺寸调整:将图像调整为神经网络所需的输入尺寸。通常,神经网络的输入要求所有样本具有相同的尺寸,因此需要将不同尺寸的图像调整为统一的大小。 6. 数据增强:对图像进行更多的数据增强操作,如随机裁剪、旋转、平移、翻转等,以进一步增加训练数据的多样性。 7. 标签编码:对图像的标签进行编码,将其转化为神经网络可以理解的形式。这可能涉及到独热编码、标签映射等。 这些步骤的具体实施方法可能因任务和数据类型而有所不同,但通常在深度学习图形数据预处理中都会涉及到这些基本步骤。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值