探索未来神经网络结构：Single Path One Shot NAS MXNet

农爱宜

于 2024-06-12 09:33:44 发布

阅读量586

点赞数 9

本文链接：https://blog.csdn.net/gitblog_00023/article/details/139614965

版权

探索未来神经网络结构：Single Path One Shot NAS MXNet

Single Path One Shot NAS MXNet 是一个创新的深度学习框架，它以惊人的效率在ImageNet数据集上完成模型训练和搜索流程，只需60个GPU小时（在4个V100 GPU上）。这个开源项目不仅在超过32^20种可能的架构中找到最佳子网，而且其结果超越了其他包括FBNet、MnasNet、DARTS等在内的NAS模型。

项目介绍

该库基于MXNet（Gluon）实现，提供了一个单一路径一次性神经架构搜索（NAS）方法。通过这个工具，研究人员可以在保持高性能的同时，轻松探索不同的模型尺寸和延迟约束条件下的最优子网结构。它引入了一种新颖的方式，在仅需一次超网训练和多次低成本搜索的情况下，实现对高效神经网络结构的优化。

项目技术分析

Single Path One Shot NAS的核心是其灵活的超网设计。每个“ShuffleNasBlock”可以有四种选择块：“SNB-3”，“SNB-5”，“SNB-7”以及“SXB-3”。每个块内还有八种通道选择。这种设计允许算法在大量可能的组合中寻找最佳平衡点，兼顾计算量、参数数量与准确性。

此外，项目还整合了Squeeze and Excitation（SE）模块，借鉴了ShuffleNet V2+和MobileNet V3的优点，提高了模型的表示能力。搜索过程不仅可以基于FLOPs和参数量进行，还可以利用“Strolling Evolution Constraints”进一步优化性能。