NEURAL ARCHITECTURE SEARCH WITH REINFORCEMENT LEARNING

最新推荐文章于 2024-01-28 20:00:01 发布

spencer_芒果

最新推荐文章于 2024-01-28 20:00:01 发布

阅读量342

点赞数

分类专栏： NaS 计算机视觉论文

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vickv/article/details/89473837

版权

提出背景：尽管过去几年深度神经网络在极具挑战的任务上取得成功，以及越来越多样化的feature设计和架构设计的出现，但是设计深度模型架构依然需要很强的专业知识以及大量时间。

本文：提出了基于梯度（gradient-based）NaS方法（如下图），此工作是基于对‘一个神经网络的结构和连通性可以被一串可变字符来明确定义’的认知，因此可以通过一个循环网络（即controller）来生成string，在真实数据集上训练被这一string明确规定的网络（即child network）并在验证集上产生准确度。用这一准确度作为反馈信号，我们可以计算policy gradient以更新controller。最终，在下一次迭代中，controller将使架构以更高的概率获得更好的准确度，也就是说，controller将通过迭代学会提高搜索网络的准确度。

相关工作：

1、超参数优化（Hyperparameter optimization ）应用广泛，缺陷：只能在固定长度的空间中搜索models。其中贝叶斯优化方法允许可变长度搜索，但是相较于本文缺少通用性和灵活性。

2、进化算法（Modern neuro-evolution algorithms）更灵活但是不实用，它们的局限性在于它们是基于搜索的方法，因此速度慢，或者需要许多启发式方法才能很好地工作。

3、NaS与program synthesi

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
NEURAL ARCHITECTURE SEARCH WITH REINFORCEMENT LEARNING

提出背景：尽管过去几年深度神经网络在极具挑战的任务上取得成功，以及越来越多样化的feature设计和架构设计的出现，但是设计深度模型架构依然需要很强的专业知识以及大量时间。本文：提出了基于梯度（gradient-based）NaS方法（如下图），此工作是基于对‘一个神经网络的结构和连通性可以被一串可变字符来明确定义’的认知，因此可以通过一个循环网络（即controller）来生成string，...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。