【Lifelong learning】Efficient Meta Lifelong-Learning with Limited Memory

最新推荐文章于 2024-09-10 20:02:49 发布

Baigker

最新推荐文章于 2024-09-10 20:02:49 发布

阅读量866

点赞数 1

分类专栏：论文阅读文章标签：机器学习深度学习

本文链接：https://blog.csdn.net/Baigker/article/details/121640089

版权

本文针对终身学习中的灾难性遗忘问题，提出了一个结合通用表征、经历复现和任务特定微调的元终身学习框架。该框架通过改进的记忆模块选择策略和局部适应方法，实现了高效的语言学习，同时显著减少了内存使用和推理时间。实验表明，这种方法在缓解遗忘和负迁移方面表现出色。

摘要由CSDN通过智能技术生成

链接：http://arxiv.org/abs/2010.02500

简介

实现lifelong learning的最大问题便是catastrophic forgetting（机器会把之前的知识忘了）。如何对抗catastrophic forgetting？目前的主流方法有三种：

正则化：学习新的任务时候，我们让参数不要变化太大（不然就没法做之前的任务了）。
复述REPLAY：学完一个任务后，存储一些样例，以便之后学新任务的时候使用。
架构Architectural：为每个任务向现有的基本模型添加特定于任务的参数。当然，也有容量固定的做法，但主要在CV领域使用，一般不好做nlp终身学习。

本文采取了第二种方法。
在本文（2020）年之前，Replay在nlp的应用集中在文本分类和QA，但有三个缺点：

要存的太多：我们需要一个超大的内存模块，即存储所有训练示例，以实现最佳性能。
还是会倒退：虽然该模型可以减轻灾难性遗忘，但其局部适应步骤容易产生负迁移，以至于在最近的任务中表现不如没有任何终身学习规则化的朴素基线。
太慢：它的推理速度非常慢，因为每个测试示例都需要大量的局部自适应步骤。

对此，本文的主要贡献有3点：

我们确定了终身学习方法的三个基本原则。我们试图在语言学习中描述它们的特点，并收集现有方法中被忽视的缺点的见解。
基于这一分析，我们提出了一个统一这三个原则的meta-lifelong框架。我们的方法是d 'Autume等人(2019)的直接扩展，它明确地将元学习模型作为局部适应的更好初始化。
我们进行了大量的实验，以证明我们提出的方法可以利用上述三个原则来实现高效的终身语言学习。我们发现，我们的框架比以前的方法性能更好，同时使用的内存减少了100倍。实验结果表明，该方法能够有效地缓解灾难性遗忘和负迁移，缩小了与多任务学习上限的性能差距。它还可能获得22倍的推理速度。

终身学习的三个基本原则

首先，我们明确一下终身学习的任务形式：
模型按顺序学习 $D^{train}=\{ D^{train}_{1},D^{train}_{2},...,D^{train}_{n} \}$ 共n个任务。
每个任务 $D^{train}_{t}=\{ (x^i_t,y^i_t)\}^{n_t}_{i=1}$

最低0.47元/天解锁文章

Baigker

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【Lifelong learning】Efficient Meta Lifelong-Learning with Limited Memory

链接：http://arxiv.org/abs/2010.02500实现终身学习的一个成功方法是通过情景记忆模块来增强学习模式(Sprechmann等人，2018年)。其基本思想是首先将之前看到的训练示例存储在记忆中，然后使用它们执行经验重放(Rolnick et al.， 2019)或导出优化约束(Lopez-Paz和Ranzato, 2017;Chaudhry等人，2019)，同时培训新任务。最近，d 'Autume等人(2019)提出使用这种记忆模块在语言领域进行稀疏经验回放和局部适应，在文本分类和
复制链接

扫一扫

专栏目录