增量学习入门【3】：模型分类

最新推荐文章于 2024-08-13 23:24:48 发布

海獭我是海獭

最新推荐文章于 2024-08-13 23:24:48 发布

阅读量601

点赞数 5

分类专栏：增量学习文章标签：深度学习

本文链接：https://blog.csdn.net/m0_70053813/article/details/134900705

版权

3 篇文章 0 订阅

订阅专栏

参考：
文献《连续学习研究进展》
文献《Deep Class-Incremental Learning: A Survey》

根据应对灾难性遗忘的措施不同，将当前增量学习模型分为以下几类：

一、基于正则化

防止与先前任务相关的权重发生漂移

EWC（权衡参数的重要性并与损失函数相关联）、PathInt、MAS、RWalk

LwF（知识蒸馏与微调相结合）、LFL、LwM、DMC、GD、iCaRL、

GEM（当前任务与记忆任务的梯度大于90°时就将其投影到离记忆梯度最近的点，以约束损失函数不增加）、iCaR、RWalk、

Piggyback、PackNet、HAT、DAN

EG、PNN、P&C、ACL、RPS

Alt
Alt

通过从一个额外的数据集蒸馏获得的增益相当小
无范例方法中，LwF得到了最好的结果
知识蒸馏正则化（LwM）获得了优于权重正则化（EWC和MAS）的结果
一般来说，增加范例可以更好地减少遗忘，且有范例的情况下再增加正则化并没有很大的改善（在加入fixed memory情况下，FT表现全比LwF好；在growing memory中，FT大部分比LwF好）
当使用固定的范例记忆时，所有的方法在每个任务后都会得到改进。然而，对于不断增长的记忆，并非所有情况都是如此
对于较长的任务序列，集群（herding）是一种比随机抽样更稳健的样本抽样方法，但对于短序列，herding并不优于其他方法
class-IL中明确处理新任务倾向偏差的方法，可以获得更好的性能
预训练模型可以减轻增量学习的负担，并表现出非常强大的性能
动态网络在评估中显示出最佳性能，但代价是额外的内存预算