[42]Oza P, Patel V M. Deep cnn-based multi-task learning for open-set recognition[J]. arXiv preprint arXiv:1903.03161, 2019.
概述:
提出了一种新的基于深度卷积神经网络(CNN)的多任务学习方法,用于开放集的视觉识别。所提出的基于多任务学习的开放集识别(MLOSR)方法包括一个共享的特征提取器网络,以及一个解码器网络和一个分类器网络,分别用于重建和分类。
- 来自解码器网络的重构误差被用于开放集的拒绝。
- 利用统计学上的极值理论对来自已知类别的重建误差分布的尾部进行建模,以提高整体性能。
- 在多个图像分类数据集上进行了实验,结果表明该方法比文献中许多有竞争力的开放集识别算法的性能要好得多。
主要贡献:
- 提出了一种基于CNN的多任务学习算法,称为MLOSR,用于开放集识别。
- 在各种数据集上的广泛实验表明,所提出的多任务训练有助于拒绝非分布式数据以及非分布式未知类的样本。
模型结构与方法:
显而易见,深度模型就是一个共享的特征提取器网络,以及一个解码器网络和一个分类器网络,分别用于重建和分类。另外,再加上一个极值机用来建模已知类的重建损失分布用来检测未知类样本。
损失函数:很简单,就是一个重建损失和一个分类损失。重建损失用L1,分类损失用交叉熵。
训练过程:包括两个过程,第一个过程训练深度模型,使用联合的L1重建损失和交叉熵分类损失。第二个过程是学习极值机(阈值0.5),建模已知类的极值分布。
测试过程:设置一个阈值,当样本的极值概率小于阈值,则接受分类结果,否则属于OOD样本。
数据集:
ID:COIL-100[35]、MNIST[30]、SVHN[36]、CIFAR10[26]和TinyImageNet[29]
OOD:COIL-100[35]、MNIST[30]、SVHN[36]、CIFAR10[26]和TinyImageNet[29],ImageNet和LSUN[32]
测试指标:
实验内容
1.Ablation实验(定量+定性)
2.开放集实验
3.OOD检测