（GEM）Gradient Episodic Memory for Continual Learning论文笔记

Lcx559

已于 2022-11-13 09:58:37 修改

阅读量536

点赞数

文章标签：人工智能

于 2022-11-13 09:58:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Lcx559/article/details/127828853

版权

（GEM）Gradient Episodic Memory for Continual Learning

Abstract

GEM：减轻了遗忘，同时允许有益的知识转移到先前的任务中。

Introduction

大多数监督学习方法假设每个例子（xi，yi）都是一个来自固定概率分布P的同分布的、独立分布的的样本。

给每个例子一个标签t，令每个例子变为（xi，ti，yi），且每个例子都时满足正态分布。

这样学习者不会经历一个例子两次，且是按照顺序进行。

GEM

GEM中主要特征为一个情景记忆Mt，储存了任务t中观察到得例子。

则第k个任务得损失为：

若最小化损失再加上上述公式会导致过拟合得出现，因此将上述公式作为不等式得约束：

可以通过计算之前任务的损失梯度向量之间的角度来诊断损失的增加和建议的更新，因此将约束条件改写为

gk表示当天任务t之前得任务k得损失梯度，以内积得形式判断两个梯度方向是否呈锐角方向更新

建议将梯度g投影到满足所有约束最近的梯度g上，通过求解L2范数找到一个满足所有约束的梯度g替代g进行更新，则上述问题可以转化为：

在这一步，发现只需要将变换g~，令其与先前每一个向量的夹角变为锐角即可，作者将其转化为了2次规划的对偶问题进行了求解：

计算出v后，我们的g~可得：

算法原理图

总结于这两篇博客，感谢两位作者的分享：

Gradient Episodic Memory for Continual Learning 论文阅读+代码解析_编程龙的博客-CSDN博客【论文笔记】Gradient Episodic Memory for Continual Learning_疯狂的小猴子h的博客-CSDN博客

博客等级

码龄4年

26
原创

10
点赞

33
收藏

0
粉丝

关注

私信

热门文章

上一篇：: 浅谈Dropout

下一篇：: RNN学习

最新评论

PCT: Point Cloud Transformer论文阅读及理解
沙树林: 我复现的时候为什么在取点的那个sample_and_group中最后new_points = torch.cat((grouped_points_norm, new_points), dim=-1)的时候，维度不对呢？代码中是最后一维进行连接，而我是倒数第二维才能连接
Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题“Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models”听起来非常专业和引人入胜。您在深入探讨高分辨率视频合成和潜在扩散模型方面的研究上取得了显著进展，这真是令人印象深刻。在我看来，您在博客上的连续创作表明了您对这个领域的热情和扎实的研究能力。接下来，我希望能看到您在这个主题上扩展更多内容，例如探索不同的应用场景、与其他相关技术的比较或者是实验结果的进一步分析，以加深我们对高分辨率视频合成的理解。虽然我知道这需要大量的努力和时间，但我相信您的深入研究将为我们带来更多有价值的见解。请继续保持谦虚的态度，您的博客是我学习和了解最新研究进展的重要来源。期待您未来的创作，愿您在接下来的旅程中继续取得成功！
PCT: Point Cloud Transformer论文阅读及理解
_代牛牛_: Wv is ignored since it is a weight matrix of the Linear layer. I is an identity matrix comparable to the diagonal degree matrix D of the Laplacian matrix and A is the attention matrix comparable to the adjacency matrix E.
PCT: Point Cloud Transformer论文阅读及理解
_代牛牛_: 文中： Wi因为时Laplace层的权重矩阵，因此被忽视？（这里有点不懂，评论区有大佬帮忙解释一下吗）请问一下为啥呢？
GOOD: A global orthographic object descriptor for 3D object recognition and manipulation论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。