数据增强之改变RGB通道的强度

在读Alexnet论文时,他提到了避免过拟合中使用到的方法,其中之一是数据增强。数据增强是一种通过对训练数据进行变换和扰动来增加样本多样性和泛化能力的技术。它有助于提高模型的鲁棒性和泛化性能,减少过拟合的风险。

在数据增强部分中提到了两个方法,一个就是对图像旋转裁剪等,另一个是“The second form of data augmentation consists of altering the intensities of the RGB channels in training images.”

这里提到的"altering the intensities of the RGB channels in training images" 是一种数据增强的方法之一,我认为应该是属于色彩抖动。色彩抖动(Color Jittering)是一种常见的数据增强方法,用于改变图像的色彩信息,增加数据的多样性和鲁棒性。

色彩抖动可以通过在RGB通道上引入小幅度的随机扰动来实现,包括亮度、对比度、饱和度和色调的变化。这样做的目的是模拟现实世界中颜色的变化,使模型对不同颜色条件下的图像更具有鲁棒性。
具体来说,色彩抖动可以包括以下几种变换:

  • 亮度抖动(Brightness Jittering):通过随机改变图像的亮度,增加或减少RGB通道的数值来调整图像的整体亮度。

  • 对比度抖动(Contrast Jittering):通过随机变换图像的像素值范围来增加或减少对比度,修改RGB通道的数值范围。

  • 饱和度抖动(Saturation Jittering):通过随机增加或减少图像中颜色的饱和度,改变RGB通道的数值来调整图像的色彩鲜艳度。

  • 色调抖动(Hue Jittering):通过随机改变图像的整体色调,对RGB通道进行线性或非线性的变换。

需要注意的是,对于每个样本,色彩抖动的变换参数可以是随机的,也可以是固定的,并根据任务和数据集进行调整以获得最佳效果。

Alexnet对图片的RGB像素值集执行PCA。具体来说,对整个ImageNet训练集的RGB像素值的集合进行PCA。对每张训练图像,将找到的主成分的倍数相加,其大小与对应的特征值成比例,乘以一个从均值为0,标准差为0.1的高斯中抽取的随机变量。因此,对于每一个RGB图像像素Ixy = [ IRxy、IGxy、IBxy]T,添加了如下的量:

[p1, p2, p3] [α1λ1, α2λ2, α3λ3]T

其中Pi与λi分别是RGB像素 3 × 3 协方差矩阵的第 i 个特征向量与特征值, αi 是前面提到的随机变量。对于特定训练图像的所有像素每个 αi 仅提取一次,直到这张图再次被用于训练才会再次提取随机变量。这个方案大致抓住了原始图片的重要特征,即那些不随光线强度与颜色变化的物体特征。该方法将top-1误差率降低1%以上。

对于图像来说,协方差矩阵、特征向量和特征值都是与图像的统计特征和结构性特征相关的概念。

1.协方差矩阵(Covariance Matrix):协方差矩阵是一个对称的二阶方阵,用于描述两个或多个变量之间的协方差关系。在图像领域中,可以将图像看作一个二维数据矩阵,其中每个像素的灰度值作为一个变量。协方差矩阵可以通过计算图像中像素之间的协方差来获得,其中协方差度量了两个像素变量之间的相关性。协方差矩阵提供了图像的统计信息,包括像素的亮度分布、对比度等。
2.特征向量(Eigenvector):特征向量是指在线性代数中,对于给定的矩阵,其与该矩阵相乘后所得到的向量仅改变了一个标量倍数(特征值)。在图像处理中,协方差矩阵的特征向量表示了图像中某种结构性特征的方向,比如纹理、边缘等。特征向量对应于图像中的主要方向或主要成分,并且可以用于降维、特征提取或图像变形等任务。
3.特征值(Eigenvalue):特征值是与特征向量相对应的标量倍数,用于衡量特征向量在变换后的尺度变化。在图像处理中,特征值表示了对应特征向量的重要性或权重。较大的特征值表明对应的特征向量在表达图像中的结构特征方面更具显著性。特征值可以用于解释数据的变量之间的方差分布结构,并被广泛应用于主成分分析(PCA)等降维算法中。

简而言之,协方差矩阵描述了图像中像素之间的相关性,特征向量表示了图像中的结构方向,而特征值表示了特征向量的重要性程度。这些概念可用于图像处理、特征提取和图像分析等任务中。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值