【连续学习之Foster算法】2022年ECCV会议论文：Foster Feature boosting and compression for class-incremental learning

Better Bench

已于 2024-12-27 11:49:54 修改

阅读量1.5k

点赞数 25

分类专栏：博士每天一篇文献连续学习（增量学习/终身学习）文章标签：算法学习 boosting 增量学习动态扩展知识蒸馏类别增量

于 2024-10-09 18:21:44 首次发布

本文链接：https://blog.csdn.net/weixin_43935696/article/details/142793387

版权

博士每天一篇文献同时被 2 个专栏收录

142 篇文章

订阅专栏

连续学习（增量学习/终身学习）

98 篇文章

订阅专栏

1 介绍

年份：2022

期刊： European conference on computer vision

引用量：251

代码：https://github.com/G-U-N/ECCV22-FOSTER

Wang F Y, Zhou D W, Ye H J, et al. Foster: Feature boosting and compression for class-incremental learning[C]//European conference on computer vision. Cham: Springer Nature Switzerland, 2022: 398-414.

本文提出了一种名为FOSTER的新颖两阶段学习范式，用于类别增量学习，该范式通过动态扩展新模块来适应新类别，并通过网络结构蒸馏策略去除冗余参数和特征维度，以维持单一的主干模型。

Foster.pdf

2 创新点

两阶段学习范式：提出了一个名为FOSTER的新型两阶段学习范式，用于类别增量学习，包括特征增强（boosting）和特征压缩（compression）两个阶段。
动态模块扩展：在特征增强阶段，动态扩展新的模块来适应新类别，通过拟合目标模型和原始模型输出之间的残差来增强模型对新类别的识别能力。
有效的知识蒸馏策略：在特征压缩阶段，通过一种有效的知识蒸馏策略去除冗余参数和不一致的特征维度，以维持单一的主干模型，减少存储和计算开销。
对类别不平衡的调整：引入了Logits Alignment策略来减轻类别不平衡造成的分类偏差，通过调整老类别和新类别的logits比例来平衡对老类别和新类别的学习。
特征增强策略：提出了Feature Enhancement策略，通过初始化一个新的线性分类器并使用知识蒸馏，鼓励新模块学习老类别，增强模型对老类别的表示能力。
平衡蒸馏策略：在特征压缩阶段，提出了Balanced Distillation策略，考虑类别先验并调整不同类别的蒸馏信息权重，以适应类别不平衡的训练数据集。
实验验证：在CIFAR-100和ImageNet-100/1000等不同设置下验证了FOSTER方法的有效性，并在多个基准测试中取得了最先进的性能。

3 相关研究

知识蒸馏（Knowledge Distillation）：
- 目标是将教师模型的"暗知识"转移到学生模型，通过鼓励学生模型的输出接近教师模型的输出。
- Hinton, G., Vinyals, O., Dean, J., et al.: Distilling the knowledge in a neural network. arXiv preprint arXiv:1503.02531 2(7) (2015)
rehearsal（复演策略）：
- 使模型能够部分访问旧数据，通过存储以前任务的示例进行复演。
- Rebuﬃ, S.A., Kolesnikov, A., Sperl, G., Lampert, C.H.: icarl: Incremental classifier and representation learning. In: CVPR, pp. 2001–2010 (2017)
Dynamic Architectures（动态架构）：
- 创建新模块来动态处理不断增长的训练分布。
- Douillard, A., Ram´e, A., Couairon, G., Cord, M.: Dytox: Transformers for continual learning with dynamic token expansion. arXiv preprint arXiv:2111.11326 (2021)
Boosting（提升算法）：
- 一类将弱学习器转换为强学习器的机器学习算法。
- Zhou, Z.H.: Ensemble Methods: Foundations and Algorithms. CRC Press (2012)
Class-Incremental Learning Setup（类别增量学习设置）：
- 描述了类别增量学习的基本过程，其中模型在每个阶段接收一批新的训练数据，并要求在所有已见过的类别上表现良好。
- French, R.M.: Catastrophic forgetting in connectionist networks. Trends Cogn. Sci. 3(4), 128–135 (1999)

4 算法

4.1 算法原理

特征增强（Feature Boosting）阶段：

动态模块扩展：在每一轮新类别的学习中，算法会动态扩展一个新的模块来适应新类别的数据。这个新模块专门用来拟合目标模型和原始模型输出之间的残差，即新类别数据的预测误差。
知识蒸馏：为了维持对旧类别的识别能力，算法利用知识蒸馏技术，通过旧模型的输出来指导新模块的学习，确保新模块在处理旧类别时不会破坏已有的知识。
对类别不平衡的调整（Logits Alignment）：由于新旧类别的数据量可能存在不平衡，算法通过调整新旧类别在模型输出（logits）上的权重比例，来减轻这种不平衡对模型学习的影响。
特征增强策略：为了进一步促进新模块对旧类别的学习，算法引入了一个额外的线性分类器，要求新模块的特征表示能够正确分类所有已见过的类别。

特征压缩（Feature Compression）阶段：

参数和特征维度的精简：在特征增强阶段，模型可能会增加大量的参数和特征维度。为了维持单一的主干模型并减少存储与计算开销，算法通过知识蒸馏策略来压缩模型，移除冗余的参数和不一致的特征维度。
平衡蒸馏：在执行知识蒸馏时，算法考虑了类别不平衡的问题，通过为不同类别的蒸馏信息分配不同的权重，来进一步优化模型的性能。