初始假设
假设 X ∈ R n × d X \in R^{n \times d} X∈Rn×d,即为 n n n个样本, d d d维的矩阵,将每个数据矢量的条目合并,使得 X i T = ( X i 1 , … , X i d ) X_i^T = (X_i1, \ldots, X_id) XiT=(Xi1,…,Xid)。 在将这些向量放入数据矩阵之前,我们实际上会减去数据的平均值,即: μ = 1 n ∑ i = 1 n X i = ( ∑ i = 1 n X i 1 , … , X i d ) T \mu = \frac{1}{n} \sum_{i=1}^n X_i = (\sum_{i=1}^n X_i1, \ldots, X_id)^T μ=n1i=1∑nXi=(i=1∑nXi1,…,Xid)T
然后用每一列减去 μ T \mu^T μT,得到零中心向量作为矩阵的行:
X = ( X 1 T − μ T X 2 T − μ T … X n T − μ T ) X = \begin{pmatrix} X_1^T - \mu ^T \\ \\ X_2^T - \mu ^T \\ \ldots \\ \\ X_n^T - \mu ^T \end{pmatrix} X=⎝⎜⎜⎜⎜⎜⎜⎛X1T−μTX2T−μT…XnT−μT⎠⎟⎟⎟⎟⎟⎟⎞