P-DARTS论文概要

针对问题
(1)DARTS在CIFAR10上实验时,直接将搜索阶段到的8个cell的网络在实际应用阶段扩充到20个cell,normal cell和reduction cell结构保持不变,在浅层网络搜索到的最优结构在深层网络上表现不一定也会最优。
(2)在进行架构搜索时由于跳跃连接加速前向/反向传播,经常导致更快的梯度下降,因此在优化架构参数时其分配的权重较大,最后搜索到的结构往往包含大量的跳跃连接,但是其不含参数,对视觉表征学习贡献小,使得模型稳定性欠佳。
解决方法
(1)采用渐近搜索策略,逐步延长网络的深度:
在这里插入图片描述
针对增加深度对GPU内存的负担,在每个阶段使用搜索空间近似对低权重操作进行删减:
在这里插入图片描述
(2)提出搜索空间正则化:
①使用操作级别的dropout减少跳跃连接在训练期间的优势。
②控制跳跃连接出现的次数为M,如果跳过连接的数量少于M,在这个cell中搜索具有最大架构权重的 M 个跳跃连接操作,并将其他的权重设置为 0,然后使用修改的架构参数重新构建单元。
其中 ②应用在 ①之上。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值