主成分分析 从协方差矩阵出发求主成分

1.含义

        主成分分析的基本思想是通过构造多个变量的线性组合,产生一系列互不相关的新变量,并从中选出少数的几个新变量使它们包含尽可能多的原变量所包含的数据信息。代替原变量分析问题,从而避免原变量之间产生共线性。

2.相关概念

        记样本数据矩阵为:

(1.1)

        X_{j}表示样本数据的各列,也就是每条数据的第j个分量,表示各个特征指标。X^{(k)}表示样本数据的各行,表示各条数据,则样本数据的方差矩阵为:

(1.2)

         其中:

(1.3)(1.4)

 

        样本的相关系数举矩阵R为:

(1.5)

        其中 :

 

(1.6)(1.7)

3.从协方差矩阵S出发求主成分

        设\lambda _{1}\geq \lambda _{2}\geq \cdots \geq \lambda _{p} \geq0为协方差矩阵S(公式(1.2))的特征值a_{1},a_{2},\cdots ,a_{p}是其相对应的单位特征向量,且彼此正交,设定第i个主成分为

 (1.8)

        样本主成分写为:

 亦可以从相关系数出发求主成分,其与协方差出发区别是将原始变量进行了标准化处理。

        这样就把原数据转化成了互不相关的数据形式,接下来要做的就是按照多元线性回归预测数据解决问题。

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
好的,我来回答你的问题。 首先,我们需要明确主成分分析的目标是什么。主成分分析的目标是将原始数据转换为一组新的变量,这些新变量是原始变量的线性组合,且彼此之间不相关。这些新变量被称为主成分,它们按照方差大小依次排列,第一主成分方差最大,第二主成分方差次之,以此类推。 手算主成分的步骤如下: 1. 计算协方差矩阵 2. 对协方差矩阵进行特征值分解 3. 按照特征值从大到小排序,得到特征值和对应的特征向量 4. 将特征向量标准化 5. 将标准化后的特征向量与原始数据相乘,得到主成分 下面以一个简单的例子来说明如何手算主成分。 假设有三个变量 $X_1, X_2, X_3$,它们的协方差矩阵为: $$ \Sigma = \begin{bmatrix} 2 & 1 & 0 \\ 1 & 2 & 1 \\ 0 & 1 & 2 \end{bmatrix} $$ 首先,我们需要对协方差矩阵进行特征值分解。计算得到特征值为 $\lambda_1 = 3, \lambda_2 = 2, \lambda_3 = 1$,对应的特征向量为: $$ \begin{aligned} \mathbf{v}_1 &= \begin{bmatrix} 1 \\ 1 \\ 0 \end{bmatrix} \\ \mathbf{v}_2 &= \begin{bmatrix} -1 \\ 1 \\ 0 \end{bmatrix} \\ \mathbf{v}_3 &= \begin{bmatrix} 0 \\ 0 \\ 1 \end{bmatrix} \end{aligned} $$ 注意,这里的特征向量已经被标准化了。 接下来,我们将标准化后的特征向量与原始数据相乘,得到主成分: $$ \begin{aligned} Z_1 &= \mathbf{v}_1^T \mathbf{X} \\ Z_2 &= \mathbf{v}_2^T \mathbf{X} \\ Z_3 &= \mathbf{v}_3^T \mathbf{X} \end{aligned} $$ 其中,$\mathbf{X}$ 是原始数据矩阵,每一列代表一个变量。 这样,我们就得到了三个主成分 $Z_1, Z_2, Z_3$。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值