iCaRL:Incremental Classifier and Representation Learning学习笔记

Lcx559

已于 2022-11-04 16:30:22 修改

阅读量1.4k

点赞数 1

文章标签： python 算法深度学习神经网络

于 2022-11-04 15:26:20 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Lcx559/article/details/127689768

版权

iCaRL: Incremental Classifier and Representation Learning

三大要求

可以对任何时间出现的任何例子进行训练
可以在任何时候为迄今观察到的类提供一个分类器
计算和内存需要保持在一定的范围内

iCaRL三大组成

用最接近平均例子这一规则进行分类
基于群的有限示例选择
利用知识蒸馏和原型演练进行表征学习

Method

Classification

依靠示例集合P进行分类，每个类都有一个示例集合P，其算法如下：

Train

采用增量学习策略，一次处理成批的类，每当有新数据就调用下图的更新算法：

ARchitecture

iCaRL使用的是卷积神经网络，使用sigmoid函数进行输出。

Nearest-Mean-of-Exemplars Classification

使用了最近平均示例的分类策略，为每个类计算一个原型向量，记为μ，μ是一个类所有示例的平均特征向量，根据μ对新类进行分类

Background

改变了神经网络的分类规则，由sigmoid函数分类改为上述的由最近平均示例进行分类，这种分类方式在类增是无需将所有权重进行更新，只需改变类原型，使分类器对特征变换具有鲁棒性。

Representation Learning

首先iCaRL构造了一个增强的训练集，该训练集由当前可用的训练实例和存储的示范组成，接下来，针对每个例子对当前的网络进行评估，并存储之前所有类别的网络输出结果(不包括新类别，因为网络还没有被训练过)。最后，通过最小化一个损失函数来更新网络参数。

Background

训练集被增强了。
损失增强了，包括了分类损失，以及蒸馏损失。

Exemplar Management

每个类的示例集中示范的个数是相等的，（或许可以不相等，改变各示例集所占权重，易混淆的类示例集占比例更大？）

示例集管理由两个程序负责

为新类选择示范。算法4：选择使得所有示例的平均特征向量最接近所有训练例子的平均特征向量的那个例子。
减少以前示范集的大小.算法5为了将示例的数量从任何m'减少到m，只需丢掉m+1到m，保留下1到m

Background

示例管理程序的设计有两个目标：初始示例集应该很好地接近类的平均向量，而且应该可以在算法运行期间在不违反这一特性的任何时候删除示例。

总的来说，iCaRL的示范选择和缩减步骤完全符合增量学习的设定：每个类别只需要一次选择步骤，即当它第一次被观察到并且其训练数据可用时。在以后的时间里，只需要调用还原步骤，它不需要访问任何早期的训练数据。

Learning with a Fixed Data Representation

设计一个分类器架构：

NCM（最近类均值）分类器架构，将每个类表示为一个原型向量，该原型向量是迄今为止观察到的该类别的所有样例的平均特征向量。

一个新的样例的分类方法是将原型与该样例的特征向量最相似的类别标签分配给它，而这个指标也可以从数据中学习。

在iCaRL中选择一个特别的子集进行NCM计算，这样可以保持一个较小的内存占用。

Representation Learning

在iCaRL中采用了复述的原则，为了更新学习表征的模型参数，我们不仅使用当前可用的类的训练数据，而且还使用早期类的示范。

在iCaRL中对不同时间点之间的神经网络进行蒸馏，防止信息随时间推移而发生恶化。

Experiment

Benchmark Protocol

对于一个给定的多类分类数据集，各类以固定的随机顺序排列。然后，每个方法在现有的训练数据上以类增量的方式进行训练。在每一批类别之后，在数据集的测试部分数据上对所产生的分类器进行评估，只考虑那些已经训练过的类别。评估的结果是每一批类的分类准确率的曲线。

通过两个数据对模型进行了评估：

iCIFAR-100基准：我们使用CIFAR-100数据，每次以2、5、10、20或50个类别的批次训练所有100个类别。评价指标是测试集上的标准多类准确性。由于数据集的规模可控，我们用不同的类顺序运行该基准十次，并报告结果的平均数和标准
iILSVRC基准：我们使用ImageNet ILSVRC 2012数据集，有两种设置：只使用100个类的子集，以10个批次进行训练(iILSVRC-small)或使用所有1000个类，以100个批次处理(iILSVRC-full)。评估指标是数据集中价值部分的top-5准确率。

iCaRL Implementation

对于iCIFAR-100,使用theano训练一个32层的resnet。
对于iILSVRC，使用tensorflow训练一个18层的resnet

Results

将iCaRL与finetuning学习、LwFMC学习方法进行了比较，可以看出iCaRL明显的优于其他的方法。

通过显示不同学习方法生成的混淆矩阵。

iCaRL的混淆矩阵在所有类别上看起来都是同质的，无论是对角线条目(即正确的预测)，还是非对角线条目(即错误)。这表明，iCaRL在学习过程中对早期或后期遇到的类没有内在的偏见。特别是，它不会受到灾难性遗忘的影响。

Differential Analysis

iCaRL通过三个方面有所不同：通过使用平均示例分类规则，在表征学习中使用示例，以及使用蒸馏损失。较之微调的训练更有优势。

通过对这三个方面分别缺失进行了一个对比实验。

hybrid1：与iCaRL相同方式学习表征，不使用平均示例分类器。

hybrid2：使用示例进行分类，不使用蒸馏损失

hybrid3：既不使用蒸馏损失，也不使用示范，在表征学习中使用示范

Conclusion

iCaRL，这是一种用于类增量学习的策略，它同时学习分类器和特征表示。1)一个对数据表示的变化具有鲁棒性的最近平均分类器，同时每个类只需要存储少量的样本；2)一个基于群(herding)的步骤，用于优先选择样本；3)一个表征学习步骤，使用样本与蒸馏相结合，以避免灾难性的遗忘。

其代码主要流程图：

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Lcx559 CSDN认证博客专家 CSDN认证企业博客

码龄3年

26: 原创

148万+: 周排名

120万+: 总排名

1万+: 访问

: 等级

273: 积分

0: 粉丝

10: 获赞

9: 评论

31: 收藏

私信

关注

热门文章

最新评论

PCT: Point Cloud Transformer论文阅读及理解
沙树林: 我复现的时候为什么在取点的那个sample_and_group中最后new_points = torch.cat((grouped_points_norm, new_points), dim=-1)的时候，维度不对呢？代码中是最后一维进行连接，而我是倒数第二维才能连接
Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题“Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models”听起来非常专业和引人入胜。您在深入探讨高分辨率视频合成和潜在扩散模型方面的研究上取得了显著进展，这真是令人印象深刻。在我看来，您在博客上的连续创作表明了您对这个领域的热情和扎实的研究能力。接下来，我希望能看到您在这个主题上扩展更多内容，例如探索不同的应用场景、与其他相关技术的比较或者是实验结果的进一步分析，以加深我们对高分辨率视频合成的理解。虽然我知道这需要大量的努力和时间，但我相信您的深入研究将为我们带来更多有价值的见解。请继续保持谦虚的态度，您的博客是我学习和了解最新研究进展的重要来源。期待您未来的创作，愿您在接下来的旅程中继续取得成功！
PCT: Point Cloud Transformer论文阅读及理解
小猿先森: Wv is ignored since it is a weight matrix of the Linear layer. I is an identity matrix comparable to the diagonal degree matrix D of the Laplacian matrix and A is the attention matrix comparable to the adjacency matrix E.
PCT: Point Cloud Transformer论文阅读及理解
小猿先森: 文中： Wi因为时Laplace层的权重矩阵，因此被忽视？（这里有点不懂，评论区有大佬帮忙解释一下吗）请问一下为啥呢？
GOOD: A global orthographic object descriptor for 3D object recognition and manipulation论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。