NAS搜索之DARTS-
动机
指出现有算法通过设定阈值使得达到条件,搜索停止,这种方式不大行,指出阈值设置不当,往往得不到好的架构,而且架构本身搜索也存在噪声,通过设置阈值比较困难(感觉在针对darts+)
解决方式
本文提出了更加直接巧妙的方法,通过设置辅助跳过连接,来确保每个操作公平竞争。
原理
如图所示,darts-中添加了一个辅助skip,其中可学习参数
x
1
至
x
5
x_1至x_5
x1至x5,𝛽为不可学习,且随epoch不断衰减。有两层作用,第一防止梯度消失,类似resnet的skip的作用,第二,开始训练,𝛽≫
x
5
x_5
x5,架构参数会更关注conv和pooling等op操作,当𝛽衰减,skip的操作的架构参数
x
5
x_5
x5 关注度会上升,而此时,其他op操作中的W已经训练的不错了,这样比较容易公平竞争,训练也就更加稳定,不至于偏向skip的
x
5
x_5
x5。