P-DARTS论文概要

莫问余年

已于 2022-03-05 16:47:46 修改

阅读量345

点赞数

分类专栏： NAS 文章标签：人工智能计算机视觉神经网络算法深度学习

于 2022-03-05 15:19:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44373865/article/details/123284649

版权

NAS 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

针对问题：
（1）DARTS在CIFAR10上实验时，直接将搜索阶段到的8个cell的网络在实际应用阶段扩充到20个cell，normal cell和reduction cell结构保持不变，在浅层网络搜索到的最优结构在深层网络上表现不一定也会最优。
（2）在进行架构搜索时由于跳跃连接加速前向/反向传播，经常导致更快的梯度下降，因此在优化架构参数时其分配的权重较大，最后搜索到的结构往往包含大量的跳跃连接，但是其不含参数，对视觉表征学习贡献小，使得模型稳定性欠佳。
解决方法：
（1）采用渐近搜索策略，逐步延长网络的深度：
在这里插入图片描述
针对增加深度对GPU内存的负担，在每个阶段使用搜索空间近似对低权重操作进行删减：

（2）提出搜索空间正则化:
①使用操作级别的dropout减少跳跃连接在训练期间的优势。
②控制跳跃连接出现的次数为M，如果跳过连接的数量少于M，在这个cell中搜索具有最大架构权重的 M 个跳跃连接操作，并将其他的权重设置为 0，然后使用修改的架构参数重新构建单元。
其中 ②应用在 ①之上。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
P-DARTS论文概要

针对问题：（1）DARTS在CIFAR10上实验时，直接将搜索到的8个cell的网络扩充到二十个cell，normal cell和reduction cell结构保持不变，无法保证该网络结构效果会更好。（2）在进行架构搜索时由于跳跃连接梯度下降快，使得优化架构参数时其分配的权重较大，最后搜索到的结构往往包含大量的跳跃连接，导致模型不稳定。解决方法：（1）采用渐近搜索策略，逐步延长网络的深度：针对增加深度对GPU内存的负担，对操作进行删减：（2）...
复制链接

扫一扫

专栏目录

莫问余年 CSDN认证博客专家 CSDN认证企业博客

码龄6年

20: 原创

20万+: 周排名

94万+: 总排名

2万+: 访问

: 等级

231: 积分

7: 粉丝

13: 获赞

17: 评论

156: 收藏

私信

关注

热门文章

分类专栏

Transform 3篇
NAS 6篇
python杂记 5篇
零零碎碎 3篇
神经网络 2篇

最新评论

Token裁剪总结
CoefficientX: EViT那篇论文链接错了，应该是NOT ALL PATCHES ARE WHAT YOU NEED: EXPEDITING VISION TRANSFORMERS VIA TOKEN REORGANIZATIONS
python地图可视化
嘎嘎会飞: 有文档嘛
IDEA新增SQL提示
qq_53364022: 没有inject language
IDEA新增SQL提示
qq_53364022: 没有最后一个怎么办？
LSP（实时肖像演讲）算法
莫问余年: 我记得这个代码里面有一个文件夹里面有几个示例人物的头像，把人物换成你想要的就可以，实时的话还不太清楚。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。