Life Long Learning

最新推荐文章于 2022-11-26 21:15:00 发布

Multi-task

最新推荐文章于 2022-11-26 21:15:00 发布

阅读量548

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34527082/article/details/98394362

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Life Long Learning

目标
遇到的问题,挑战:
相关算法
参考:

如果真的实现一个网络处理所有问题, 离真正的人工智能就不远了.

目标

希望一个模型能够对多种类型的目标进行处理(learning).
在不同的目标依次学习的前提下, 不遗忘之前学习到的知识.

遇到的问题,挑战:

遗忘: 学习了新的task2之后, 老的task1 准确度下降. 需要保证task1的准确性, 同时希望task2也能学好.
提升: 希望不同任务之间能够触类旁通, 不同任务之间互相辅助.
模型复杂度控制: 如何判断学习task2之后, task1的效果下降是模型参数太少还是真的由于先后原因被遗忘. 以及什么条件下需要增加参数.
curriculum learning. 学习的先后顺序也非常重要.

在线流式训练中, 早期的样本和当前的样本所包含的内容也可能不同, 只不过变化是连续的, 不像多任务中, 各个任务是有一个明确的变化节点. 所以很有可能也存在这种问题.

相关算法

1. 抗遗忘: Elastic Weight consolidation(EWC)

大体思路, 如果一个参数对之前的任务非常重要, 那么在当前任务训练时, 尽量不要修改它:
$L'(\theta) = L(\theta) + \lambda \sum_{i}b_i(\theta_i -\theta_i^b)^2$ 其中, $b_i$ 为控制 $\theta_i$ 变化程度的参数. $\theta_i$ 为当前的学习参数, 而 $\theta_i^b$ 为上一个task学习到的 $\theta_i$ 的值.
最简单的 $b_i$ 参数, 通过 $\theta_i$ 的二次导数绝对值大小决定.

2. 抗遗忘: 训练能够生成之前task样本的模型

conducting multi-task learning by generating pseudo-data using generative model.

有点类似人类大脑自己回想问题, 自己创造case

3. 提升: Gradient Episodic Memory (GEM)

希望新的task的训练过程中, 对老的task的效果也有提升.
具体做法是, 在使用 $\theta_i^{t_j}$ 的gradient $g_i^{t_{j}}$ 更新 $\theta_i^{t_j}$ 的时候, 参考之前task中 $\theta_i$ 的gradient $g_i^{t_{j-1}}$ , $g_i^{t_{j-2}}$ , $g_i^{t_{j-3}}$ …, $g_i^{t_{1}}$ . 使用历史gradient修正当前 $g_i^{t_{j}}$ 为 $g_i^{'}$ , 使得:
$g_i^{'} . g_i^{t_{k}} \ge 0 , \forall 0 \le k \le j$ 意思就是修正后的方向不与之前的方向重冲突.

4. Model Expansion

1. Progressive Neural Networks

每有一个新的Task, 创建新的网络, 新网络的各层, 接入老Task等层的前一层当输入:
Progressive Neural Networks

2. Expert Gate

每当有一个新任务, 通过一个Task Detector 网络, 判断新任务和那个任务最像, 使用最像的网络, 来init 一个新的task的model. 每一个新任务, 一个新的model.

3. Net2Net

当当前的任务学习的准确率不高时, 对网络的节点进行分裂. 一分为二, 将layer变宽.

参考:

李宏毅深度学习

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Life Long Learning

Life Long Learning目标遇到的问题,挑战:相关算法1. 抗遗忘: Elastic Weight consolidation(EWC)2. 抗遗忘: 训练能够生成之前task样本的模型3. 提升: Gradient Episodic Memory (GEM)4. Model Expansion1. Progressive Neural Networks2. Expert Gate3....
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。