主成分分析 从协方差矩阵出发求主成分

1.含义

        主成分分析的基本思想是通过构造多个变量的线性组合,产生一系列互不相关的新变量,并从中选出少数的几个新变量使它们包含尽可能多的原变量所包含的数据信息。代替原变量分析问题,从而避免原变量之间产生共线性。

2.相关概念

        记样本数据矩阵为:

(1.1)

        X_{j}表示样本数据的各列,也就是每条数据的第j个分量,表示各个特征指标。X^{(k)}表示样本数据的各行,表示各条数据,则样本数据的方差矩阵为:

(1.2)

         其中:

(1.3)(1.4)

 

        样本的相关系数举矩阵R为:

(1.5)

        其中 :

 

(1.6)(1.7)

3.从协方差矩阵S出发求主成分

        设\lambda _{1}\geq \lambda _{2}\geq \cdots \geq \lambda _{p} \geq0为协方差矩阵S(公式(1.2))的特征值a_{1},a_{2},\cdots ,a_{p}是其相对应的单位特征向量,且彼此正交,设定第i个主成分为

 (1.8)

        样本主成分写为:

 亦可以从相关系数出发求主成分,其与协方差出发区别是将原始变量进行了标准化处理。

        这样就把原数据转化成了互不相关的数据形式,接下来要做的就是按照多元线性回归预测数据解决问题。

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值