结合主动学习和半监督的高光谱分类

最新推荐文章于 2025-08-28 08:00:00 发布

MJJ_

最新推荐文章于 2025-08-28 08:00:00 发布

阅读量2.3k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：主动学习高光谱分类半监督文章标签：主动学习高光谱分类半监督学习

本文链接：https://blog.csdn.net/seamoon201314/article/details/79677200

该博客探讨了结合主动学习和半监督学习在高光谱图像分类中的应用。通过挖掘代表性和判别性信息，提出DRDbSSAL算法，旨在解决样本不足的问题。主动学习用于选择最具信息量的样本，而半监督学习则用于挖掘未标记数据的结构。实验表明，这种方法在多个数据集上提高了分类性能。

摘要解决高光谱图像中样本不足的两种途径有主动学习和半监督学习。前者提高样本的质量，后者试图提高样本数量。代表信息：有监督的聚类结果获取未标记样本的重要的结构信息。结合主动学习，结合判别信息（SVM分类器）。

介绍

主动学习：考察未标记数据，选择信息量最大的(most informative)的样本加入下一次迭代。选中的样本标记后加入L集（labeled），并从U集（unlabeled）中移除。主动学习需要人力去标记一些样本。
半监督学习：更关注未标记数据，以无监督的方式获取信息。
本文方法：DRDbSSAL: discovering representativeness and discriminativeness by semisupervised active learning. representativeness代表性试图捕捉未标记数据的整体分布，discriminativeness在给定的标记样本下提高分类准确率。两者之间有一个tradeoff。

本文方法

记总样本集为D，已知标签的样本集为L，未知的为U（主动学习的candidate pool）。U中的一些样本可以被分给伪标签来改进训练模型，记为T，剩余的不能分配给伪标签的记为S。

A. 主动学习的query function

query function是主动学习的关键，其选择最具信息量的样本交给人类专家做标记。本文提出的DRDbSSAL方法采用了MCLU这种衡量的方法，multiclass level uncertainty。
binary SVM分类器，one-against-all结构，每个样本 $x \in U$ 到每个hyperplane的距离表示为{ f