线性代数笔记:PCA算法推导

PCA是主成分分析,一种数据降维技术,用于去除噪声和减少计算量。在PCA中,通过样本中心化后寻找最小重构误差的主方向。本文详细介绍了PCA的原理,包括样本中心化步骤和最小重构误差公式的推导。
摘要由CSDN通过智能技术生成

PCA原理概述

PCA是主成分分析(Principal Components Analysis)的简称。这是一种数据降维技术,用于数据预处理。一般我们获取的原始数据维度都很高,那么我们可以运用PCA算法降低特征维度。这样不仅可以去除无用的噪声,还能减少很大的计算量。

PCA和SVD类似,仍然是一种数据压缩的算法。
找到诸如 A A ′ AA^\prime AA B B ′ BB^\prime BB 距离最小的主方向u,使得所有原始点与投影点之间的误差最小,即最小重构误差。
在这里插入图片描述

样本中心化

在做PCA之前,一般要先对样本点中心化,即样本矩阵取均值:
在这里插入图片描述
在这里插入图片描述

最小重构误差公式推导

先假设只有一个样本 x x x(用向量 x → \overrightarrow{x}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值