目标降维
将x1-x2平面的坐标点转化为y1-y2平面的坐标点,在y1-y2平面上的点大多都是投影投射到以y1为基向量的方向上,从而在y1-y2平面中转化的点大多都处于y1轴上,从而忽视y2轴
基向量的选择
y1-y2平面的选择要求投射到y1轴上有少量的重合点避免数据的缺失。我们知道方差可以用来衡量数值的分散程度,在PCA中选取通过方差的最大化可以保证在数值的映射过程中会有尽可能少的重合。
构造y1-y2平面的坐标轴一边是以合适的基向量为方向,另一方向为正交向量。由此得到以下的数学公式:
u
=
arg max
u
1
m
∑
i
=
1
m
(
x
i
T
u
)
2
\begin{aligned} u =\argmax_{u}& \frac{1}{m}{\displaystyle\sum_{i=1}^{m} {(x_i^Tu)}^2} \end{aligned}
u=uargmaxm1i=1∑m(xiTu)2