无监督增量学习 Unsupervised Class-Incremental Learning Through Confusion. ICLR 2021 被拒文章

最新推荐文章于 2024-09-13 08:43:26 发布

祥瑞Coding

最新推荐文章于 2024-09-13 08:43:26 发布

阅读量3.2k

点赞数 2

分类专栏：机器学习 continual learning 论文解析

本文链接：https://blog.csdn.net/weixin_36474809/article/details/116720405

版权

机器学习同时被 3 个专栏收录

133 篇文章 54 订阅

订阅专栏

论文解析

46 篇文章 5 订阅

订阅专栏

continual learning

18 篇文章 13 订阅

订阅专栏

乔治亚州研究所提出的。针对无监督的类别增量提出了本文的方法。本文基于无监督，增量数据没有标签，因此范畴就是选用了增量学习之中最宽松的限制，即基于样本回放的增量学习方法，旧样本会被存储在模型Memory之中。因为此文的前提设定有些奇怪，比如样本是同类别成批到来的，这种假设基本很难实现。据说openreview是被ICLR拒的，但是作者arxiv上显示的是accepted by ICLR，后来去除掉了。

论文地址：[2104.04450] Unsupervised Class-Incremental Learning Through Confusion (arxiv.org)

2.2 detection-training

2.3 算法流程

2.3 基于类别均衡的detection-training

3.实验

4.结论

1.贡献点

1.1思路

大多数增量任务是有监督学习。

2019年有一个无监督的方法，根据决策边界来训练。解决无监督的类别增量，需要将两个步骤进行好，判断新任务属于哪个类别。一个任务叫做novelty-detection，用于判断新增量任务的数据属于哪个类别，属于旧类别还是新类别，如果判断错了，则相当于给数据引入了噪音，造成不良影响。另一个任务就是针对网络预测的标签进行网络训练。

OOD（out-of-distribution）方法通过leverage distance-based thresholds来实现。OOD用于解决一个问题，就是神经网络经常会对没有训练过的反常样本做出overconfident的预测。（文中提到的OOD方法没有读过，但是这里单从字面理解，可能是，神经网络会对没有训练过的样本过于相信，导致网络输出的confidence过高，遇是OOD就设置了一个阈值，将样本距离大于该阈值的样本剔除掉，避免了confidence过高的问题。）本文提出了iLAP框架，Incremental learning by Accuracy Performance，字面意思理解，就是将网络对类别进行训练，然后根据网络Accuracy的变化来判断增量样本是旧类还是新类。（本文提出的是无监督的方法，既然无监督，那就没有标签，这里的准确率是如何判断的？根据后文，本文采用的是，新类训练后，用已有的旧类的准确率的改变作为衡量标准。）

所以，本文的方法就是对新类衡量标准的一个改进，旧类的衡量标准是样本空间的distance，本文的衡量标准是新类到来后，旧类accuracy的改变。所以有以下优点：

阈值不取决于有标签样本，可以更加intuitive和可调节
模型表现相对于新到的样本更加独立（因为衡量标准是旧类的准确率变化，如果准确率变化更大，则模型将新到样本分为新类，旧类被影响的较少。）
模型更能区分similar classes，即不容易混淆

1.2 贡献点

提出了iLAP框架，Incremental learning by Accuracy Performance. 可以就解决无监督类别增量问题。

即使在类别不均+无监督的情况下，本文方法也可取得与有监督学习相近点准确率。

证实了传统OOD方法的失败。

2.方法

2.1 settings

假定模型learner是L, 将新到的增量数据集分为E1, E2, E3, E4等，每个增量数据集具有对应的图片，Ei={e1i,e2i,e3i…,enii}。模型设定每个样本的标签是yi。这里的增量数据是无标签的，这个标签只是网络的预测的标签。

网络会针对所有已有标签永久保持两个数据集，分别是训练集和验证集：

从1到K分别是类别，相当于模型针对每个类别保存一个训练集和验证集。模型就根据已有的数据集进行accuracy的分析。

2.2 detection-training

detection-training的意思，并不是目标检测中的detection，而是一种训练模式。类似于试探性训练的意思，即训练之前保留权重，试探性的训练一下，根据之前任务准确率的变化来判断是否继续训练还是回退到试探性训练之前。

假定模型权重是L，L是L的一份拷贝，新到的数据被分配为标签K+1, 并被划分为训练集和验证集：Etrain和Eval, 与之前存储的旧类别：Ptrain和Pval共同训练拷贝出来的权重L, 然后通过Pval上的前K类的准确率的下降获得向量，此向量用于衡量已有类别的准确率的下降。