Locality Preserving Dimensionality Reduction and Classification for Hyperspectral Image Analysis
作者: Wei Li, Saurabh Prasad, James E. Fowler, Lori Mann Bruce
主要工作: 传统的高光谱数据降维算法假设数据服从单一分布, 事实上高光谱数据服从的分布比较复杂, 针对这一问题,提出 LFDA+GMM 模型的降维与分类方法.
核心思路: 先对高光谱数据用 LFDA 进行降维, 减小 GMM 评估参数的数量, 保持数据的多模态结构, 然后用 GMM 对降维后的数据进行分类
概念理解:
- LFDA: LDA 和 LPP 的结合
为什么要降维? 降维可以减少 GMM 估计参数. 例如: 如果样本数据是 200 维, 包含10 个高斯分布, 那就有 10* 200* 2 个参数, 后面的 2, 表示每个分布, 每个维度均值和方差各一个参数
- 高斯分布: 通常假设整个数据集服从同一高斯分布, 即: 数据结构可以通过平均值和方差来度量
- 为什么要引入GMM?
高维数据服从的未知分布比较复杂, 可以假设该复杂分布可以通过
个高斯分布的线性组合进行刻画.
- GMM: 高斯混合模型. 假设数据包含 K 个高斯分布, 每个高斯分布对应一个均值和方差, 总共要确定 2K 个参数, 通过EM算法可以进行参数评估.
个高斯分布分别对应的均值和方差确定之后, 数据结构即可度量.
- 高斯分布个数确定: 在高光谱数据中采用 AIC 评估参数 K 的值
- GMM分类器: 高斯混合模型不但可以用来评估复杂分布参数, 还可以看作一个类似SVM的分类器
在 Mnist 数据集上, 假设整个数据集包含
个 高斯分布的分类结果:
准确率: 0.978700
高光谱 Pavia university 数据集实验结果: 93.782 (
作训练, 剩下做测试)
% compute the probablity