【论文阅读】Contiual learning with hypernetwork

最新推荐文章于 2024-06-11 09:39:22 发布

轮子去哪儿了

最新推荐文章于 2024-06-11 09:39:22 发布

阅读量3k

点赞数 5

分类专栏： continual learning 论文阅读文章标签：超网络 hypernetwork CL 继续学习终生学习

本文链接：https://blog.csdn.net/weixin_42419002/article/details/104012165

版权

该博客介绍了如何利用超网络实现继续学习（CL），通过任务条件超网络、分块超网络和任务无关推理来处理任务之间的权重生成和记忆。论文在MNIST、CIFAR-10和CIFAR-100数据集上展示了超网络在CL中的有效性和潜力。

摘要由CSDN通过智能技术生成

文章目录

【论文阅读】2019_Contiual learning with hypernetwork

【论文阅读】2019_Contiual learning with hypernetwork

1. 超网络简介

本文是使用超网络来实现继续学习(CL)的，超网络(hypernetwork)是谷歌在16年提出的一种网络，普通的网络是直接输出是我们想要的结果，而超网路的输出是另一个主网络B的权重，主网络B加载超网络学习到的权重之后，就能输出我们想要的结果了。通常超级网络的权重数是小于网络Ｂ的权重数量的，这就是体现了超网络的优点，约束了搜索权重的空间。

hypernetwork 这篇文章中使用超网络实现了 LSTM 和 CNN 网络的权重学习。动态超网络为循环网络生成权重，静态超网络为卷积网络生成权重。

超网络链接(谷歌的论文)：hypernework: https://arxiv.org/abs/1609.09106

2. 论文的总体介绍

论文链接：使用超网络实现继续学习：https://arxiv.org/abs/1906.00695

论文的动机：使用超网络的思想来实现CL

论文的方案：

本文提出了一个任务条件超网络( task-conditioned hypernetworks)，用于给给定任务id的主网络(主网络)B生成权重。

论文的贡献：

拓宽了超网络的应用领域，即使用超网络实现了CL。
基于超网络的CL方案不仅在标准CL基准上达到了最佳，而且在长序列任务学习上也表现很好（其他算法都没有在长序列实验上进行测试）

3. 相关的介绍

3.1. 一些数学符号

${x}^{(t,i)}$ ：第 $t$ 个任务的第 $i$ 个输入数据；
${y}^{(t,i)}$ ：第 $t$ 个任务的第 $i$ 个输入数据对应的标签；
${X}^{(t)}=\{x^{(t, i)}\}_{i=1}^{n_{t}}$ ：第 $t$ 个任务的输入数据是一个集合，由输入数据组成；
${Y}^{(t)}=\{y^{(t, i)}\}_{i=1}^{n_{t}}$ ：第 $t$ 个任务的标签数据是一个集合；
${X}^{(t)}$ ：第 $t$ 个任务的所有输入数据；
${Y}^{(t)}$ ：第 $t$ 个任务的输入数据对应的数据标签；

$n_{t} \equiv\left|{X}^{(t)}\right|$ ：第 $t$ 个任务的数据的个数；
${X}^{(t)}, {Y}^{(t)})$ ：第 $i$ 任务提供的所有数据，即输入数据和输入数据对应的标签。
$\hat{Y}^{(t)}$ ：使用模型(网络) $f_{trgt}(\cdot, \Theta^{(t-1)})$ 计算出的合成标签(synthetic targets)；

$\Theta(t-1)$ 或 $\Theta_{trgt}(t-1)$

最低0.47元/天解锁文章

轮子去哪儿了

关注

5
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
【论文阅读】Contiual learning with hypernetwork

文章目录【论文阅读】CONTINUAL LEARNING WITH HYPERNETWORKS【论文阅读】CONTINUAL LEARNING WITH HYPERNETWORKS超网络实现的连续学习：https://www.leiphone.com/news/202001/OjZScNwcSfO3Tthq.html...
复制链接

扫一扫

专栏目录