统计学习方法第十六章——主成分分析

最新推荐文章于 2022-11-27 21:15:47 发布

YakultGo

最新推荐文章于 2022-11-27 21:15:47 发布

阅读量592

点赞数

分类专栏：统计学习方法文章标签：学习线性代数机器学习

本文链接：https://blog.csdn.net/weixin_43869610/article/details/124554472

版权

统计学习方法专栏收录该内容

13 篇文章 1 订阅

订阅专栏

博客详细推导了多元统计中协方差矩阵的性质，包括式子(16.3)和(16.4)的证明，涉及矩阵求导和拉格朗日乘数法。通过Python计算了一个相关矩阵的特征值和特征向量，并解释了特征值在方差贡献率中的作用。此外，还展示了如何计算因子负荷量。

摘要由CSDN通过智能技术生成

式子(16.3)和(16.4)的推导

由式子(16.2)和 $\Sigma=\operatorname{cov}(\boldsymbol{x}, \boldsymbol{x})=E\left[(\boldsymbol{x}-\boldsymbol{\mu})(\boldsymbol{x}-\boldsymbol{\mu})^{\mathrm{T}}\right]$ 得
$\begin{aligned} \operatorname{var}\left(y_{i}\right) &=E\left[\left(y_{i}-E\left(y_{i}\right)\right)\left(y_{i}-E\left(y_{i}\right)\right)^{T}\right] \\ &=E\left[\left(\alpha_{i}^{T} x-\alpha_{i}^{T} \mu\right)\left(\alpha_{i}^{T} x-\alpha_{i}^{T} \mu\right)^{T}\right] \\ &=E\left[\left(\alpha_{i}^{T}(x-\mu)\right)\left(\alpha_{i}^{T}(x-\mu)\right)^{T}\right] \\ &=E\left[\alpha_{i}^{T}(x-\mu)(x-\mu)^{T} \alpha_{i}\right] \\ &=\alpha_{i}^{T} E\left[(x-\mu)(x-\mu)^{T}\right] \alpha_{i} \\ &=\alpha_{i}^{T} \Sigma \alpha_{i} \end{aligned}$
式子(16.3)得证，同理可以证明式子(16.4)
$\begin{aligned} \operatorname{cov}(y_{i},y_{j}) &=E\left[\left(y_{i}-E\left(y_{i}\right)\right)\left(y_{j}-E\left(y_{j}\right)\right)^{T}\right] \\ &=E\left[\left(\alpha_{i}^{T} x-\alpha_{i}^{T} \mu\right)\left(\alpha_{j}^{T} x-\alpha_{j}^{T} \mu\right)^{T}\right] \\ &=E\left[\left(\alpha_{i}^{T}(x-\mu)\right)\left(\alpha_{j}^{T}(x-\mu)\right)^{T}\right] \\ &=E\left[\alpha_{i}^{T}(x-\mu)(x-\mu)^{T} \alpha_{j}\right] \\ &=\alpha_{i}^{T} E\left[(x-\mu)(x-\mu)^{T}\right] \alpha_{j} \\ &=\alpha_{i}^{T} \Sigma \alpha_{j} \end{aligned}$
式子(16.7)最优化问题推导补充

首先要知道矩阵求导的几个简单法则：
$\frac{\partial\left(\boldsymbol{x}^{T} \boldsymbol{a}\right)}{\partial \boldsymbol{x}}=\frac{\partial\left(\boldsymbol{a}^{T} \boldsymbol{x}\right)}{\partial \boldsymbol{x}}=\boldsymbol{a}\\ \frac{\partial\left(\boldsymbol{x^{T}} \boldsymbol{x}\right)}{\partial \boldsymbol{x}}=2 \boldsymbol{x}\\ \frac{\partial\left(\boldsymbol{x}^{T} \boldsymbol{A} \boldsymbol{x}\right)}{\partial \boldsymbol{x}}=\boldsymbol{A} \boldsymbol{x}+\mathbf{A}^{T} \boldsymbol{x}$
所以拉格朗日函数求导并令其得0为：
$\begin{aligned} 原式&=\frac{\partial{\alpha_1^T\Sigma\alpha_1}}{\partial{\alpha_1}}-\frac{\lambda\partial{\alpha_1\alpha}}{\partial{\alpha_1}}\\ &=\Sigma\alpha_1+\Sigma^T\alpha_1-2\lambda\alpha_1\\ &=2\Sigma\alpha_1-2\lambda\alpha_1\\ &=0 \end{aligned}$

【例16.1】一些计算的补充

首先求相关矩阵R的特征值和特征向量，这边就直接使用python来求解，毕竟所给的数据不太好手动求

import numpy as np

mat = np.array([[1, 0.44, 0.29, 0.33],
                [0.44, 1, 0.35, 0.32],
                [0.29, 0.35, 1, 0.60],
                [0.33, 0.32, 0.60, 1]])

eigenvalue, featurevector = np.linalg.eig(mat)

print("特征值：", np.around(eigenvalue, decimals=2))
print("特征向量：", np.around(featurevector, decimals=3))

可以看到，特征值和书上一样的，但是特征向量不一样，不过这没影响，毕竟特征向量本来就不唯一。

$y_1的方差贡献率为\frac{\lambda_1}{\sum_{i=1}\lambda_i}=\frac{2.17}{4}=0.543$ ，同理 $y_2的方差贡献率为\frac{\lambda_2}{\sum_{i=2}\lambda_i}=\frac{0.87}{4}=0.218$

因子负荷量的计算公式为： $\rho(y_k,x_i)=\sqrt{\lambda_k}e_{ik}$

YakultGo

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法第十六章——主成分分析

式子(16.3)和(16.4)的推导由式子(16.2)和Σ=cov⁡(x,x)=E[(x−μ)(x−μ)T]\Sigma=\operatorname{cov}(\boldsymbol{x}, \boldsymbol{x})=E\left[(\boldsymbol{x}-\boldsymbol{\mu})(\boldsymbol{x}-\boldsymbol{\mu})^{\mathrm{T}}\right]Σ=cov(x,x)=E[(x−μ)(x−μ)T]得var⁡(yi)=E[(yi−E(yi))(y
复制链接

扫一扫

专栏目录