多元统计分析学习——PCA
主成分分析的引入(基本知识)
目的与原理
通过一组变量的几个线性组合可以解释这组变量的方差-协方差结构,从而可以达到数据的压缩和数据的解释
换句话说:p个成分的总体的变异性是可以用k个主成分来说明
question
几个线性组合:这里主成分但并不是p个随机变量的子集,而是其线性组合,具体可参见主成分定义
方差-协方差结构:
何为主成分
p个随机变量
代数角度:p个随机变量的一些特殊的线性组合
几何角度:是一种什么样的特殊的线性组合呢?这些线性组合会形成一个新的坐标系,