增量学习BiC: Large Scale Incremental Learning_bias correction+-baijiahao&-CSDN博客

本文链接：https://blog.csdn.net/weixin_41870042/article/details/125995887

该博客介绍了一个名为BiC（biasCorrection）的方法，旨在解决大规模增量学习中训练数据不平衡的问题。BiC属于使用部分旧数据的增量学习类别，通过添加一个校正层来调整最后一层全连接层的偏置。实验表明，BiC能有效提高旧类别预测的准确性，接近使用全部数据训练的效果。文章还探讨了训练集和验证集的划分比例以及旧数据样例的选择策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

paper: https://arxiv.org/abs/1905.13260
code: https://github.com/wuyuebupt/LargeScaleIncrementalLearning

BiC针对现在增量学习方法在大规模数据集上表现不好的这个问题，提出了BiC（bias Correction)这个方法，并且还提出了增量学习在大规模数据集上存在的两个问题：

训练数据的不平衡；
随着增量学习进行下去，类别会越来越多，这样特征相似的类别就会变多。（就又需要区分相似类别这个问题）

而本文的BiC方法就是用来解决第一个问题的，即解决训练数据不平衡的问题。

等一会再解释一下大规模数据集上为什么会存在训练数据不平衡的问题。

作者在如何利用旧数据集信息的角度上，将增量学习分为三大类：

完全不使用到旧数据。EWC、LwF等
使用合成的数据，利用GAN网络生成和旧数据分布相同的数据。
使用部分旧数据，从旧数据中按某种方式抽取一部分样例，再和新数据一起训练。

BiC就属于第三类，使用了部分旧数据。现在就可以解释为什么会存在训练数据不平衡的问题了。在大规模数据集上，每一类的数据都非常多，而抽取的部分旧数据不可能有很多，每次都是取少部分的旧数据，也就是说旧类别中的每一类数据量和新类别每一类的数量相差非常大，两者一起训练的时候，就会存在数据不平衡的问题。

（举个例子：假设旧数据现在有100类，增量学习一次增加10个类别，这个新类别的数据有600个，假如从旧数据中选取1000个样本数据，即每个旧类别挑选10个数据，这样训练的时候每个新类有600个数据，每个旧类别只有10个数据，也就产生了训练数据不平衡）
在这里插入图片描述作者先假设 FC Layer is Biased ，最后一层FC是存在偏置的。然后用两个实验来验证自己的这个假设：

实验一：
用Cifar100做5次增量学习，每次新增20类。下图是80到100的那次增量学习的混淆矩阵。里面的一个点代表True classs被预测成为另一个类的概率，对角线就是这个类被预测正确的概率。可以看到80-100这20个新类对应的对角线都接近红色，即这20个类被预测正确的概率接近于1。而对于0-18这80个旧类别，可以看到对角线的概率不高，但是横坐标80-10，纵坐标0-80这个区域颜色相对更亮，即0-80这些旧类别被预测成80-100这20个新类的概率更高。即旧类更倾向于被预测成为新类。
在这里插入图片描述
实验二：
还是在Cifar10上做的实验。如下图，分五次增量。
蓝线指普通分类器训练结果，
红线指BiC纠正FC层之后的结果，
橙线指用全部的新旧数据训练最后一个FC层的结果，
绿线指用全部的新旧数据训练整个网络的结果。
在这里插入图片描述