深度学习基础(五)—— 数据预处理

PCA(主成分分析)常用于数据降维,尤其在图像处理中。PCA通过对数据进行旋转找到主方向,减少冗余信息。通过保留主成分,可以将高维数据降至一维或更低维,同时保持数据的大部分方差。PCA白化和ZCA白化是两种常用的预处理方法,它们使得数据具有单位方差并减少特征间的相关性。选择主成分的数量通常是依据保留的方差比例,如90%-99%。
摘要由CSDN通过智能技术生成

1 PCA

主成分分析法,一般用于数据降维。WHY?
图像中相邻的像素高度相关,输入数据是有一定冗余的。具体来说,假如我们正在训练的16x16灰度值图像,记为一个256维向量 x256,其中特征值 xj对应每个像素的亮度值。由于相邻像素间的相关性,PCA算法可以将输入向量转换为一个维数低很多的近似向量,而且误差非常小。

1.1 PCA实例

数据:
这里写图片描述
这些数据已经进行了预处理,使得每个特征x1x2 具有相同的均值(零)和方差。PCA算法将寻找一个低维空间来投影我们的数据。从下图中可以看出,u1 是数据变化的主方向,而 u2是次方向。
这里写图片描述

也就是说,数据在u1方向上的变化要比在 u2方向上大。为更形式化地找出方向 u1u2,我们首先计算出矩阵Σ,如下所示:

Σ=1mmi=1(x(i))(x(i))T.
假设x的均值为零,那么Σ就是x的协方差矩阵。可以证明,数据变化的主方向u1就是协方差矩阵Σ的主特征向量,而 u2 是次特征向量。
先计算出协方差矩阵Σ的特征向量,按列排放,而组成矩阵U

U=[|||u1u2un|||]
此处,u1是主特征向量(对应最大的特征值),u2是次特征向量。以此类推,另记

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值