ProxyLessNAS

最新推荐文章于 2024-03-25 10:00:18 发布

AliceLeeHX

最新推荐文章于 2024-03-25 10:00:18 发布

阅读量4.7k

点赞数 2

分类专栏： NAS 文章标签： NAS

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aliceleehx/article/details/88663004

版权

ProxyLessNAS是一种新的神经架构搜索（NAS）方法，直接在大型数据集上进行搜索，无需代理任务。它解决了GPU内存问题，通过二值化路径学习和处理非微分硬件指标。这种方法打破了传统的块堆叠网络结构，通过剪枝实现网络紧致性，并优化硬件性能，如延迟。

摘要由CSDN通过智能技术生成

ProxyLessNAS : Direct Neural Architecture Search On Target Task And Hardware

Related Work

Proxy Tasks:

1.在小数据集上训练

2.只学习一些小的Blocks

3.只训练一小部分的Epoch

基于Proxy Tasks的流程结构

Motivation

1.基于 Proxy Tasks的NAS方法并没有考虑到诸如Latency等性能的影响

2.现存的NAS结构是采用搜索Block的方法进行Stack组成最终的网络结构，但是实际情况中，每一个Block是可以不同的

3.DARTS是一种创造性的将Architecture 和Weight联合进行SGD优化的，但是在使用Proxy Tasks学习Block进行堆叠的同时又存在GPU Consumption的方法
$m_O^{DARTS}(x)=\mathop {\Sigma}\limits_{i=1}\limits^{N}p_i o_i(x)=\mathop{\Sigma}\limits_{i=1}\limits^{N}\frac{exp(\alpha_i)}{\Sigma_jexp(\alpha_j)}o_i(x)$

4.Drop Path是一种可以找到紧性的高效网络结构的方法
$m_O^{One-Shot}(x)=\mathop{\Sigma}\limits_{i=1}\limits^{N}o_i(x)$

Overview

本文提出了一种Path-Level的剪枝方法

**Step 1：**直接训练一种包含所有候选Path的超参Network

**Step 2：**在训练过程中，通过引入结构化参数来学习通路的冗余性

**Step 3：**在最终获得紧性的优化结构时将具有冗余性的Path进行剪枝

存在问题：

随着可选Operations的增加，可选Network的Size越大，会增加GPU Memory
- Solution：借助"Binary Connect"的思路，将Architecture Parameters二值化，在一个Run-Time中只允许一个Path被激活
Hardware Objectives(e.g. Latency)不可微
- 将Network Latency抽象成连续函数，利用正常的Loss进行优化
- Reinforce-Based Algorithm

基于ProxyLess的流程结构

Contributions

1.直接在大型数据集上且不需要使用Proxy Task的技术进行训练和学习

2.允许在大型的候选集上进行搜索

3.打破了Block 堆叠的Network的构成方式

4.提出了对于NAS做剪枝的方案，展示了NAS与模型压缩之间的相近的关系，同时通过Path剪枝，本文的方法节约了大约一个量级的计算量

5.提出了一个基于Latency Regularization Loss的梯度下降方法以解决硬件目标问题

Method

Construction of Over-Parameterized Network

Question:为了能够进行搜索，必须要对整个超参的网络结构进行定义

解决方案：所有的Path都是混合通路，学习的是整个Network而不是Block

将Network用 $N(e=m^1_O,...,e=m^n_O)$ 表示

$e_i$ 代表一个有向无环图的一条确定的边
$O=\{o_i\}$ 是一个含有 $N$ 个初始Operations(卷积、池化、Identity、Zero)的集合
$m_O$ 每条边上含有N条并行通路的一个混合操作

因此，对于一个输入 $x$ ，混合操作 $m_O$ 的输出结果是基于 $N$ 条通路所形成的

ProxyLess Net

Learning Binarized Path

**Question:**随着Path可选的空间逐渐扩大，Weight的运算量将不断增加

**解决方案：**二值化Path

ProxyLessNet在训练过程中，在众多的Path中，只激活一个Path，故此本文将所有的Path进行二值化处理

最低0.47元/天解锁文章

关注

2
点赞
踩
17

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。