在阅读完AlexNet的论文之后有感而发。
这篇论文开创性地使用了很多卷积神经网络中结构,小技巧,非常建议大家去精读一遍,这篇神经网络奠基级别的论文。
概要
在AlexNet中介绍了一种基于PCA的色彩增强的方法,效果就是图片的明度(明亮程度)会发生整体的变化,并且没有发生图片结构的改变或色差的明显变化。
效果如下图:
- 图像的亮度发生了明显的变化,有的暗,有的亮,而且图片的主要事物的轮廓还是十分清晰,没有发生改变;
- 事物的主导颜色没有发生变化(上面树叶的主导色绿色没有发生变化);
- 图片的相对色差没有发生改变,(原来图片暗的地方和亮的地方的对比度仍然存在)
论文中的实现方法
这里我简要地说一下论文中的实现方法:
实现步骤:
- 将图片按照
RGB
三通道进行normalization
处理,均值为0,方差为1。
值得一提的是,按照RGB
三通道进行处理,因为我们进行的是色彩增强,在RGB
三通道的图片中,决定图像色彩的是RGB
之间的相对关系,我们不能改变三通道内部的像素值分布。 - 将图片按照channel展平成大小为(?, 3)的array
- 求上述array的协方差矩阵
- 对协方差矩阵进行特征分解
- 下式的 p \mathbf{p} p 是特征向量, λ \lambda λ是特征值, α \alpha α即为我们添加的抖动系数
[ p 1 p 2 p 3 ] [ α 1 λ 1 α 2 λ 2 α 3 λ 3 ] T \begin{bmatrix}\mathbf{p}_1 & \mathbf{p}_2 & \mathbf{p}_3\end{bmatrix} \begin{bmatrix}\alpha_1\lambda_1 & \alpha_2\lambda_2 & \alpha_3\lambda_3 \end{bmatrix}^T