本文是对论文:《A Joint Band Prioritization and Band Decorrelation Approach to Band Selection for Hyperspectral Image Classification》有关公式的推导和理解。针对的是PCA-BASED BAND PRIORITIZATION的两种方法:MVPCA和NAPC。
MVPCA
在原文中提到:maximum-variance PCA (MVPCA),也就是把像素向量之间的方差按照从大到小进行排序,选出其中最大的几个方差所对应的向量。把它们作为新的降维后的波段图像。
MVPCA具体推导
根据原文我们知道,文章中定义了 Σ = 1 N ∑ i = 0 n ( x k − m ) ( x k − m ) T \Sigma = \frac{1}{N}\sum_{i=0}^n(x_{k}-m)(x_{k}-m)^{T} Σ=N1∑i=0n(xk−m)(xk−m)T。其中 Σ \Sigma Σ是数据样本的协方差矩阵。 x k x_{k} xk为高光谱图像中的第k个L维像素向量, m m m是样本均值向量, N N N是像素向量的像素总体个数。 l l l是数据维度(总体的波段个数)
由于协方差矩阵 Σ \Sigma Σ是对称非负定的,所以所有的特征值 [ λ i ] i = 1 l [\lambda_{i}]^{l}_{i=1} [λi]i=1l都是实数且非负。同时每个特征值相应的 l l l维度的特征向量: V i = ( v i 1 , v i 2 , . . . , v i l ) T V_{i}=(v_{i1},v_{i2},...,v_{il})^{T} Vi=(vi1,vi2,...,vil)T。文章中对得到对特征向量进一步转化,使它们之间单位正交。满足: ∣ ∣ V i ∣ ∣ = ( ∑ j = 1 l ( v i j ) 2 ) 1 2 = 1 ||V_{i}||=(\sum_{j=1}^l(v_{ij})^{2})^{\frac{1}{2}}=1 ∣∣Vi∣∣=(∑j=1l(vij)2)21=1。
重点来了:文章中这时定义了负载因子 r i k = λ i v i k r_{ik}=\sqrt{\lambda_{i}}v_{ik} rik=λivik 其中 k = 1 , 2 , . . . , l . k=1,2,...,l. k=1,2,...,l.
这时,文章中提到了:
p k = ∑ i = 1 l r i k 2 p_{k}=\sum_{i=1}^lr_{ik}^{2} pk=∑i=1lrik2,其中的 p k = σ k k 2 ( σ k k 2 是 第 k 个 波 段 图 像 的 方 差 ) p_{k}=\sigma^{2}_{kk}(\sigma^{2}_{kk}是第k个波段图像的方差) pk=σkk2(σkk2是第k个波段图像的方差)
如何推出呢?
首先:
∑ i = 1 l r i k 2 = ∑ i = 1 l λ i v i k 2 \sum_{i=1}^lr_{ik}^{2} = \sum_{i=1}^l\lambda_{i}v_{ik}^{2} i=1∑lrik2=i=1∑lλivik2
所以,我们只要证明出 ∑ i = 1 l λ i v i k 2 = σ k k 2 \sum_{i=1}^l\lambda_{i}v_{ik}^{2}=\sigma^{2}_{kk} ∑i=1lλivik2=σkk2即可。
由线性代数中矩阵的特征对角分解可知:
协方差矩阵 Σ \Sigma Σ可以特征分解为: Σ = p [ λ i ] d i a g p − 1 \Sigma=p[\lambda_{i}]_{diag}p^{-1} Σ=p[λi]diagp−1。其中p是协方差矩阵 Σ \Sigma Σ的特征矩阵, [ λ i ] d i a g [\lambda_{i}]_{diag} [λi]diag是特征值为对角的对角矩阵。同时,由标准正交阵的转置等于逆。可知: p T = p − 1 p^{T}= p^{-1} pT=p−1。
由以上定理可知:
Σ = { σ 11 2 σ 12 2 ⋯ σ 1 k 2 ⋯ σ 1 l 2 σ 21 2 σ 22 2 ⋯ σ 2 k 2 ⋯ σ 2 l 2 ⋮ ⋮ ⋱ ⋮ ⋮ σ k 1 2 σ k 2 2 ⋯ σ k k 2 ⋯ σ k l 2 ⋮ ⋮ ⋮ ⋱ ⋮ σ l 1 2 σ l 2 2 ⋯ σ l k 2 ⋯ σ l l 2 } = P [ λ i ] d i a g P − 1 = P [ λ i ] d i a g P T = { v 11 v 12 ⋯ v 1 k ⋯ v 1 l v 21 v 22 ⋯ v 2 k ⋯ v 2 l ⋮ ⋮ ⋱ ⋮ ⋮ v k 1 v k 2 ⋯ v k k ⋯ v k l ⋮ ⋮ ⋮ ⋱ ⋮ v l 1 v l 2 ⋯ v l k ⋯ v l l } ∗ { λ 1 0 ⋯ 0 0 λ 2 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ λ l } ∗ { v 11 v 21 ⋯ v k 1 ⋯ v l 1 v 12 v 22 ⋯ v k 2 ⋯ v l 2 ⋮ ⋮ ⋱ ⋮ ⋮ v 1 k v 2 k ⋯ v k k ⋯ v l k ⋮ ⋮ ⋮ ⋱ ⋮ v 1 l v 2 l ⋯ v k l ⋯ v l l } = { λ 1 v 11 λ 2 v 12 ⋯ λ k v 1 k ⋯ λ l v 1 l λ 1 v 21 λ 2 v 22 ⋯ λ k v 2 k ⋯ λ l v 2 l ⋮ ⋮ ⋱ ⋮ ⋮ λ 1 v k 1 λ 2 v k 2 ⋯ λ k v k k ⋯ λ l v k l ⋮ ⋮ ⋮ ⋱ ⋮ λ 1 v l 1 λ 2 v l 2 ⋯ λ k v l k ⋯ λ l v l l } ∗ { v 11 v 21 ⋯ v k 1 ⋯ v l 1 v 12 v 22 ⋯ v k 2 ⋯ v l 2 ⋮ ⋮ ⋱ ⋮ ⋮ v 1 k v 2 k ⋯ v k k ⋯ v l k ⋮ ⋮