统计学习方法学习笔记:第十六章.主成分分析

本文详细介绍了主成分分析(PCA)的概念,包括总体主成分分析和样本主成分分析。PCA通过正交变换实现数据降维,最大化保留信息。文中提到了PCA的求解方法,如特征值分解和奇异值分解,并讨论了如何选择主成分个数以及主成分与原始变量的相关性。
摘要由CSDN通过智能技术生成

第十六章:主成分分析(PCA:principal component analysis)

利用 正 交 变 换 \color{red}{正交变换} 把由线性相关变量表示的观测数据转换为少数几个 由 线 性 无 关 变 量 表 示 \color{red}{由线性无关变量表示} 线的数据,同时尽可能的保留较多的原始数据信息, 线 性 无 关 的 变 量 称 为 主 成 分 , \color{red}{线性无关的变量称为主成分}, 线属于 降 维 方 法 \color{red}{降维方法}

总体主成分分析

基本思想:首先对给定数据进行 规 范 化 \color{red}{规范化} (这里是标准化,即减均值,除标准差),使得数据的 每 一 个 变 量 均 值 为 0 , 方 差 为 1 \color{red}{每一个变量均值为0,方差为1} 01,再进行 正 交 变 换 \color{red}{正交变换} ,得到若干个 线 性 无 关 的 新 变 量 \color{red}{线性无关的新变量} 线,依次将这些新变量称为第一主成分、第二主成分等;

主 成 分 分 析 在 旋 转 变 换 中 选 取 离 样 本 点 的 距 离 平 方 和 最 小 的 轴 ( 这 样 , 变 换 后 的 方 差 才 能 最 大 ) 作 为 第 一 主 成 分 ; \color{red}{主成分分析在旋转变换中选取离样本点的距离平方和最小的轴(这样,变换后的方差才能最大)作为第一主成分;}
第二主成分等的选取,在 保 证 与 已 选 坐 标 轴 正 交 \color{red}{保证与已选坐标轴正交} 的条件下,类似的进行;

m维向量 x 到 m 维向量的线性变换:

y i = a i T x = a 1 i x 1 + a 2 i x 2 + ⋯ + a m i x m , i = 1 , 2 , . . . , m \color{red}{y_i=a_i^Tx=a_{1i}x_1+a_{2i}x_2+\cdots+a_{mi}x_m},i=1,2,...,m yi=aiTx=a1ix1+a2ix2++amixmi=1,2,...,m

c o v ( y i , y j ) = a i T Σ a j = 0 , 表 示 y i , y j 线 性 无 关 , Σ 为 x 的 协 方 差 矩 阵 \color{red}{cov(y_i,y_j)=a_i^T\Sigma{a_j}}=0,表示y_i,y_j线性无关,\Sigma为x的协方差矩阵 cov(yi,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值