NAS之《Neural Architecture Transfer》论文笔记

qq_26269815

于 2020-06-13 10:38:55 发布

阅读量1.2k

点赞数 1

分类专栏：论文笔记文章标签：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_26269815/article/details/106728909

版权

《Neural Architecture Transfer》论文探讨了一种高效的方法，通过一次运行生成多个任务的神经网络模型，重点在于构建task-specific super-net并进行进化搜索。文章介绍了accuracy predictor、evolutionary search和网络编码等关键组成部分，提出了在线迁移学习和多目标进化搜索策略，大大减少了模型评估时间和资源消耗。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

截图均来自原论文，如有侵权，请联系删除。

1、论文主要特点

高效的产生针对特定任务的模型, 一次NAT的运行就能有效地获得多个任务的神经网络

训练task-specific super-net
从super-net中采样特定的子网络，而不需要额外的训练。

大量实验表明：

通过对ImageNet上预训练好的模型进行迁移学习，往往比直接在小数据集上进行训练得到的模型好

关键是：

一个综合的在线迁移学习
多目标进化搜索过程

在搜索特定任务子网的同时，对预先训练好的super-net进行迭代调整。

NAT返回两个：

适用于不同任务的子网

super-net

训练包含重复循环两个阶段：

1、Adapt super-net

首先从进化搜索返回的最佳子网构造一个分层的经验分布。

然后，对从该分布中采样的子网进行微调

2、search stage

采用代理模型来快速预测任何抽样子网的objectives，而不需要进行全面和昂贵的评估。

预测模型本身也在线学习以前的评估子网

2、提出的方法

1、三个重要组成：

an accuracy predictor,

an evolutionary search routine,

a supernet.

2、算法流程：

开始时， an archive A of architectures (subnets) 从supernet中随机采样子网络，子网络参数直接继承于supernet。

然后重复以下两步：</

最低0.47元/天解锁文章

博客等级

码龄10年

22
原创

6
点赞

7
收藏

1
粉丝

关注

私信

分类专栏

展开全部收起

最新评论

NAS之《Neural Architecture Transfer》论文笔记
阿尔法猫: 我也有这个问题，超网的架构好像没有很明确的在论文里提出来。不过应该训练超网的思想应该类似于训练BERT之类的预训练模型，是最耗时间的部分。启发搜索sample出子网类似于下游任务fine tune？
NAS之《Neural Architecture Transfer》论文笔记
康海东: 我看文章是用8张v100跑了6天，是不是就是想得到一个20层超网的初始化权重呀
NAS之《Neural Architecture Transfer》论文笔记
康海东: 你好，有一点没看懂，想请教一下，这个超级网络作者说是在imagenet上单独拿出来warm-up的；请问这个超网是几层，是最开始的20层吗，也就是搜索子网过程中，初始化的这个超网结构不变吗？后面对每一个数据集上的搜索都是做transfer吗？那在每一个数据集上搜出来的网络结构都一样吗？

大家在看

最新文章

目录

展开全部

收起

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。