AlexNet中的图片增强--基于PCA的RGB三通道色彩抖动

AlexNet中的图片增强--基于PCA的RGB三通道色彩抖动


在阅读完AlexNet的论文之后有感而发。

这篇论文开创性地使用了很多卷积神经网络中结构,小技巧,非常建议大家去精读一遍,这篇神经网络奠基级别的论文。

概要

在AlexNet中介绍了一种基于PCA的色彩增强的方法,效果就是图片的明度(明亮程度)会发生整体的变化,并且没有发生图片结构的改变或色差的明显变化。

效果如下图:
效果图

  • 图像的亮度发生了明显的变化,有的暗,有的亮,而且图片的主要事物的轮廓还是十分清晰,没有发生改变;
  • 事物的主导颜色没有发生变化(上面树叶的主导色绿色没有发生变化);
  • 图片的相对色差没有发生改变,(原来图片暗的地方和亮的地方的对比度仍然存在)

论文中的实现方法

这里我简要地说一下论文中的实现方法:
实现步骤:

  1. 将图片按照RGB三通道进行normalization处理,均值为0,方差为1。
    值得一提的是,按照RGB三通道进行处理,因为我们进行的是色彩增强,在RGB 三通道的图片中,决定图像色彩的是RGB之间的相对关系,我们不能改变三通道内部的像素值分布。
  2. 将图片按照channel展平成大小为(?, 3)的array
  3. 求上述array的协方差矩阵
  4. 对协方差矩阵进行特征分解
  5. 下式的 p \mathbf{p} p 是特征向量, λ \lambda λ是特征值, α \alpha α即为我们添加的抖动系数
    [ p 1 p 2 p 3 ] [ α 1 λ 1 α 2 λ 2 α 3 λ 3 ] T \begin{bmatrix}\mathbf{p}_1 & \mathbf{p}_2 & \mathbf{p}_3\end{bmatrix} \begin{bmatrix}\alpha_1\lambda_1 & \alpha_2\lambda_2 & \alpha_3\lambda_3 \end{bmatrix}^T
  • 9
    点赞
  • 43
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: 基于ORL数据库的人脸图像处理,可以利用K-L变换和PCA方法进行特征降维和人脸识别。 K-L变换(Karhunen-Loève Transform)是一种线性变换方法,用于将原始图像转换为具有最大可分性的特征。首先,将ORL数据库的人脸图像进行归一化处理,消除图像的尺度和亮度差异。然后,将每个人脸图像展开为一维向量,并构建图像样本矩阵。接下来,计算样本矩阵的协方差矩阵,并对其进行特征值分解。根据特征值的大小,选取前N个最大的特征值对应的特征向量作为K-L变换的投影向量。最后,将原始图像使用这些投影向量进行线性变换,即可得到特征脸向量。通过计算待识别图像与特征脸向量的欧氏距离,可以实现人脸识别。 PCA(Principal Component Analysis)是一种常用的降维方法,通过线性变换将高维特征映射到低维的子空间。在利用PCA进行人脸识别时,首先进行数据预处理,将ORL数据库的人脸图像归一化并展开为一维向量。然后,计算样本矩阵的均值向量,并将每个样本向量减去均值向量,得到零均值样本矩阵。接下来,计算零均值样本矩阵的协方差矩阵,然后对协方差矩阵进行特征值分解。根据特征值的大小,选取前N个最大的特征值对应的特征向量作为主成分,构建PCA的投影矩阵。最后,将原始图像用投影矩阵进行线性变换,得到降维后的特征向量。通过计算待识别图像与特征向量的欧氏距离,可以进行人脸识别。 总的来说,基于ORL数据库的人脸图像处理,利用K-L变换和PCA方法可以进行特征降维和人脸识别。这些方法可以有效地提取人脸图像的主要特征,降低计算复杂度,提高人脸识别的准确率。 ### 回答2: 基于ORL数据库的KL变换和PCA方法是一种人脸识别的方法。ORL数据库是一个用于人脸识别的数据库,其包含了40个人的400张正面灰度人脸图像。 KL变换(Karhunen-Loève Transform)是一种基于统计学原理的数据降维方法。它通过计算数据的协方差矩阵的特征向量来获得数据的主要成分。在人脸识别,可以使用KL变换来降低人脸图像的维度,提取出最具有代表性的特征。 PCA方法(Principal Component Analysis)也是一种常用的降维方法。它通过计算数据的协方差矩阵和特征向量来找到数据的主要成分。在人脸识别,可以使用PCA方法将图像从高维空间映射到低维空间,提取出最具有代表性的特征。 基于ORL数据库的KL变换和PCA方法的步骤如下: 1. 将ORL数据库的人脸图像矩阵按列排成一个大矩阵,每个人脸图像作为一列。 2. 对大矩阵进行均值心化处理,即减去每一列的平均值。 3. 计算大矩阵的协方差矩阵。 4. 对协方差矩阵进行特征值分解,得到特征值和特征向量。 5. 将特征向量按特征值大小从大到小排序。 6. 选择前N个特征向量,构成一个转换矩阵。 7. 将转换矩阵应用于原始图像,得到降维后的特征脸。 8. 将降维后的特征脸作为训练集用于人脸识别,可以使用k最近邻算法或其他分类方法进行人脸识别。 KL变换和PCA方法都是常用的人脸识别方法,它们能够从高维的图像空间提取出最具有代表性的特征,有效地提高了人脸识别的准确率和效果。 ### 回答3: 基于ORL数据库,利用K-L变换和PCA方法可以实现人脸识别。首先,K-L变换是一种用于图像压缩和特征提取的数学方法,可以将原始图像转换为一组能够描述其特征的系数。PCA(Principal Component Analysis)是一种常用的统计学方法,可以将高维数据转换为低维数据,从而降低数据维度并提取出最具有代表性的特征。 在利用K-L变换和PCA进行人脸识别的流程,首先利用ORL数据库的训练图像进行训练。通过对所有训练图像进行K-L变换,将其转换为特征系数。然后使用PCA方法对特征系数进行降维处理,选择最具有代表性的主成分。这些主成分将构成人脸的特征空间。 接下来,对于待识别的人脸图像,同样进行K-L变换和PCA降维处理,得到其特征系数。然后,将待识别的特征系数与训练图像集的特征系数进行比较,可采用欧氏距离或者余弦相似度等方式进行匹配度量。通过与训练图像的匹配度量结果,可以确定待识别图像属于数据库的哪个人。 总结而言,基于ORL数据库,利用K-L变换和PCA方法能够实现人脸识别。通过训练图像的K-L变换和PCA降维处理,构建出人脸的特征空间。然后,将待识别图像的特征系数与训练图像集的特征系数进行匹配度量,从而实现人脸的分类与识别。这一方法在数字图像处理领域具有较高的应用价值,可以广泛应用于人脸识别、图像检索等方面。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值