部分内容转至知乎,具体细节待整理。
线性降维
给定d维的原始数据
X∈Rd×n
X
∈
R
d
×
n
,选择一个
r<d
r
<
d
,通过优化
fX(⋅)
f
X
(
·
)
可以得到一个投影矩阵
P∈Rr×d
P
∈
R
r
×
d
,最终可以得到
Y=PX∈Rr×n
Y
=
P
X
∈
R
r
×
n
为降维后的数据。PCA要优化的目标函数:
为什么有正交约束 PPT=I P P T = I
P P 为投影矩阵,的每一列表示新的低维空间的基(坐标轴),P具有正交约束是要低维空间的这些基之间相互正交,且是单位向量。
总的优化目标
当固定其他,更新P时,目标转化为
考虑对偶形式,
其中, λ2 λ 2 为超参数, λ λ 为拉格朗日乘子。先求 P P 和之间的关系,对P求一阶导,
对 P P 求导
第①部分求导如下,
第②部分求导如下,
第③部分求导如下,
令上述偏导=0,也即是,
故,
两边同时转置,可得关系,
对 λ λ 求导
XXXX
参考
https://www.zhihu.com/question/41120789/answer/173530798
https://zhuanlan.zhihu.com/p/21580949
Linear Dimensionality Reduction: Survey, Insights, and Generalizations