主成分分析PCA

最新推荐文章于 2024-01-01 20:21:00 发布

残阳摧雪

最新推荐文章于 2024-01-01 20:21:00 发布

阅读量447

点赞数

分类专栏：【机器学习】

本文链接：https://blog.csdn.net/u014203453/article/details/79297788

版权

【机器学习】专栏收录该内容

29 篇文章 0 订阅

订阅专栏

部分内容转至知乎，具体细节待整理。

线性降维

给定d维的原始数据 $X\in R^{d \times n}$ ，选择一个 $r<d$ ，通过优化 $f_X( · )$ 可以得到一个投影矩阵 $P\in R^{r \times d}$ ，最终可以得到 $Y=PX\in R^{r \times n}$ 为降维后的数据。PCA要优化的目标函数：

f X (P) = | | X - P T P X | | 2 F

$f_X(P)=||X-P^TPX||_F^2$

为什么有正交约束 $PP^T=I$

$P$ 为投影矩阵， $P$ 的每一列表示新的低维空间的基（坐标轴），P具有正交约束是要低维空间的这些基之间相互正交，且是单位向量。

总的优化目标

min | | P X - B S | | 2 F + λ 1 | | S | | 1 + λ 2 | | X - P T P X | | 2 F + λ 3 T r (B U B T) + λ 4 S V M_I t e m s s . t . P P T = I, \sum i | | B j | | < c

$\min {||PX-BS||^2_F+\lambda_1||S||_1+\\ \lambda_2||X-P^TPX||_F^2 +\\ \lambda_3 Tr(BUB^T)+\\ \lambda_4 SVM\_Items }\\ s.t. \ PP^T=I,\sum_i||B_j||<c$
当固定其他，更新P时，目标转化为

min s . t . | | P X - B S | | 2 F + λ 2 | | X - P T P X | | 2 F P P T = I (71) (72)

$\begin{align} \min \ & ||PX-BS||^2_F+\lambda_2||X-P^TPX||_F^2 \\ s.t. \ &PP^T=I \end{align}$

考虑对偶形式，

L (P, λ) = T r { ( P X - B S ) T ( P X - B S ) ) } ① + λ 2 T r { ( X - P T P X ) T ( X - P T P X ) } ② + λ ( P P T - I ) ③ (73) (74) (75)

$\begin{align} L(P,\lambda) = & \frac {Tr\{(PX-BS)^T(PX-BS))\}}①+ \\ &\frac { \lambda_2Tr\{(X-P^TPX)^T(X-P^TPX)\}}②+ \\ &\frac {\lambda (PP^T-I)}③ \end{align}$
其中，

λ2 λ 2 $\lambda_2$ 为超参数，

λ λ $\lambda$ 为拉格朗日乘子。先求

P P $P$ 和

λ

$\lambda$ 之间的关系，对P求一阶导，

对 $P$ 求导

第①部分求导如下，

\begin{aligned} (6) & \nabla_{P} L (①) & = \nabla_{P} T r {(P X - B S)^{T} (P X - B S)} \\ (7) & = \nabla_{P} T r {(X^{T} P^{T} - S^{T} B^{T}) (P X - B S))} \\ (8) & = \nabla_{P} T r {X^{T} P^{T} P X - S^{T} B^{T} P X - X^{T} P^{T} B S + S^{T} B^{T} B S} \\ (9) & = \nabla_{P} T r {P^{T} P X X^{T} - P X S^{T} B^{T} - P X S^{T} B^{T} + S^{T} B^{T} B S} \\ (10) & = 2 P X X^{T} - 2 (X S^{T} B^{T})^{T} \\ (11) & = 2 P X X^{T} - 2 B S X^{T} \end{aligned}

$\begin{align} \nabla_PL(①) & = \nabla_PTr\{(PX-BS)^T(PX-BS)\} \\ & = \nabla_PTr\{(X^TP^T-S^TB^T)(PX-BS))\} \\ & = \nabla_PTr\{X^TP^TPX-S^TB^TPX-X^TP^TBS+S^TB^TBS\} \\ & = \nabla_PTr\{P^TPXX^T-PXS^TB^T-PXS^TB^T+S^TB^TBS\} \\ & = 2PXX^T-2(XS^TB^T)^T \\ & = 2PXX^T-2BSX^T \end{align}$
第②部分求导如下，

\nabla P L (②) = λ 2 \nabla P T r {(X - P T P X) T (X - P T P X)} = λ 2 \nabla P T r {(X T - X T P T P) (X - P T P X)} = λ 2 \nabla P T r {X T X - X T P T P X - X T P T P X + X T P T P P T P X} = λ 2 \nabla P T r {X T X - X T P T P X - X T P T P X + X T P T P X} = λ 2 \nabla P T r {X T X - X T P T P X} = 2 λ 2 P X X T (12) (13) (14) (15) (16) (17)

$\begin{align} \nabla_PL(②) & = \lambda_2\nabla_PTr\{(X-P^TPX)^T(X-P^TPX)\} \\ & = \lambda_2\nabla_PTr\{(X^T-X^TP^TP)(X-P^TPX)\} \\ & = \lambda_2\nabla_PTr\{X^TX-X^TP^TPX-X^TP^TPX+X^TP^TPP^TPX\} \\ & = \lambda_2\nabla_PTr\{X^TX-X^TP^TPX-X^TP^TPX+X^TP^TPX\} \\ & = \lambda_2\nabla_PTr\{X^TX-X^TP^TPX\} \\ & =2 \lambda_2PXX^T \\ \end{align}$
第③部分求导如下，