KPCA —— Kernel based Principle Component Analysis
题目1:证明样本集合协方差矩阵的特征向量处于样本所张成的空间
即: v ∈ s p a n { x 1 , … , x m } v \in span\{\boldsymbol{x}_1, \dots ,\boldsymbol{x}_m\} v∈span{ x1,…,xm},设有样本集合: X = { x 1 , … , x m } \boldsymbol{X}=\{\boldsymbol{x}_1, \dots ,\boldsymbol{x}_m\} X={ x1,…,xm},假设样本均值为 0 0 0,即: ∑ i = 1 m x i = 0 \sum_{i=1}^m \boldsymbol{x}_i = 0 ∑i=1mxi=0。
证:样本协方差矩阵为: C = 1 m ∑ j = 1 m x j ⋅ x j T \boldsymbol{C} = \frac{1}{m} \sum_{j=1}^m \boldsymbol{x}_j \cdot \boldsymbol{x}_j ^\mathbf{T} C=m1∑j=1mxj⋅xjT,令 λ \lambda λ为 C \boldsymbol{C} C的特征值, v \boldsymbol{v} v为对应的特征向量,则有:
(1) λ v = C v = 1 m ∑ j = 1 m x j ⋅ x j T v \lambda \boldsymbol{v} = \boldsymbol{C}\boldsymbol{v} = \color{red}\frac{1}{m}\sum_{j=1}^m \boldsymbol{x}_j \cdot \boldsymbol{x}_j^\mathbf{T} \boldsymbol{v} \tag{1} λv=Cv=m1j=1∑mxj⋅xjTv(1)
即:
(2) v = 1 m λ ∑ j = 1 m x j T v ⋅ x j \boldsymbol{v} = \color{red} \frac{1}{m \lambda}\sum_{j=1}^m \boldsymbol{x}_j^\mathbf{T} \boldsymbol{v} \cdot \boldsymbol{x}_j \tag{2} v=mλ1j=1∑mxjTv⋅xj(2)
因此, v ∈ s p a n { x 1 , … , x m } \boldsymbol{v} \in span\{\boldsymbol{x}_1, \dots ,\boldsymbol{x}_m\} v∈span{
x1,…,xm}
题目2:推导特征空间中协方差矩阵特征值和特征向量的求解方法
设有样本集合: X = { x 1 , … , x m } \boldsymbol{X}=\{\boldsymbol{x}_1, \dots ,\boldsymbol{x}_m\} X={
x1,…,xm},取非线性映射: ϕ : R d → F \phi: R^d \rightarrow \mathcal{F} ϕ:Rd→F, R d R^d Rd为样本所处的 d d d维欧氏空间,称为输入空间, F \mathcal{F} F为一个Hilbert空间,称为特征空间,样本在特征空间中的内积可以用一个核函数来计算, k ( x , y ) = ϕ ( x ) T ϕ ( y ) k(\boldsymbol{x}, \boldsymbol{y}) = \phi(\boldsymbol{x})^\mathbf{T}\phi(\boldsymbol{y}) k(x,y)=ϕ(x)Tϕ(y)。假设样本集合在特征空间中均值为 0 0 0,即: ∑ i = 1 m ϕ ( x i ) = 0 \sum_{i=1}^m \phi(\boldsymbol{x}_i) = 0 ∑i=1mϕ(xi)=0。
样本在特征空间中的协方差矩阵为:
(3) C ˉ = 1 m ∑ i = 1 m ϕ ( x i ) ϕ ( x i ) T \bar{\boldsymbol{C}} = \frac{1}{m} \sum_{i=1}^{m} \phi(\boldsymbol{x}_i) \phi(\boldsymbol{x}_i)^\mathbf{T} \tag{3} Cˉ=m1i=1