关于NASAS的论文笔记

最新推荐文章于 2021-09-12 14:39:30 发布

帅气的风

最新推荐文章于 2021-09-12 14:39:30 发布

阅读量613

点赞数

分类专栏：深度学习文章标签： NAS

本文链接：https://blog.csdn.net/bensss20112011/article/details/100109530

版权

此篇博客来自这篇论文One-Shot Neural Architecture Search Through A Posteriori Distribution Guided Sampling

一.介绍NAS

NAS全称是Neural Architecture Search, 就是神经网络架构搜索。这一思想主要是从迁移学习的方向引伸出来。我主要介绍它的优化问题，在NAS中，解决就是两个问题，一个是权重优化，一个是网络结构的优化。
最原始的NAS优化问题如下
$w_a^{*} = argmin_{w_a}L_t(M(a, w_a))$
$a^* = argmin_{a\in G}L_v(M(a, w_a^{*}))$
其中G代表的是一些网络预先定义网络结构，比如3x3卷积核等，t代表训练集，v代表验证集， $M(a,w_a)$ 代表网络结构和权重的网络。
结构如下：（图片居中不了抱歉）
NASAS
由于这种结构优化起来很慢，计算复杂度高，因而有了很多改进，近几年就出现one-shot model 可以有效提高优化速度，但存在权重和网络结构的无匹配问题。现在讲讲关于基于后验分布的one-shot model可以有效提高效率并且不需要Fine-tune，利用权重共享就能达到较高性能和准确率，由于以往的NAS很少能适应大型数据集，而这种方法能较好适应。

二. 关于基于后验分布的NAS的思想

NAS的问题是如何从训练集中得到网络并且具有泛化性能，泛化性能我们是通过验证集来进行做的。基于后验分布的NAS思想就是这样，我们就是要从一个训练集中去得到网络结构和权重参数，那我们可以用贝叶斯的方法求解。
$p(\varphi|X, Y) = \frac{p(Y|X, \varphi)p(\varphi)}{\int_{\varphi}p(Y|X, \varphi)}$
这里的 $\varphi=\{\varphi_{l,k}^s\}($ 这里的

最低0.47元/天解锁文章

帅气的风

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
关于NASAS的论文笔记

一.介绍NASNAS全称是Neural Architecture Search, 就是神经网络架构搜索。这一思想主要是从迁移学习的方向引伸出来。我主要介绍它的优化问题，在NAS中，解决就是两个问题，一个是权重优化，一个是网络结构的优化。最原始的NAS优化问题如下wa∗=argminwaLt(M(a,wa))w_a^{*} = argmin_{w_a}L_t(M(a, w_a))wa∗=ar...
复制链接

扫一扫