1. 背景介绍
1.1 深度学习与模型设计
深度学习作为人工智能领域近年来最受关注的领域之一,已经在图像识别、自然语言处理、语音识别等领域取得了令人瞩目的成就。然而,深度学习模型的设计一直是一个复杂且耗时的过程,需要专业的知识和经验。传统的模型设计方法通常依赖于人工试错,效率低下且难以找到最优解。
1.2 神经架构搜索的诞生
为了解决模型设计难题,神经架构搜索(Neural Architecture Search,NAS)应运而生。NAS 是一种自动化技术,旨在利用计算机算法自动搜索最佳的神经网络架构,从而减少人工干预,提高模型设计的效率和性能。
1.3 NAS 的发展历程
NAS 的研究始于20世纪80年代,但直到近年来才取得突破性进展。早期的 NAS 方法主要基于强化学习和进化算法,计算成本高且效率低下。近年来,随着可微分架构搜索和基于梯度的方法的提出,NAS 的效率和性能得到了显著提升,并在各种任务中取得了比人工设计的模型更好的性能。
2. 核心概念与联系
2.1 搜索空间
搜索空间定义了 NAS 算法可以搜索的模型架构的范围。常见的搜索空间包括:
- 链式结构搜索空间: 这种搜索空间主要关注网络的深度和层数,例如 ResNet、DenseNet 等。
- 多分支结构搜索空间: 这种搜索空间允许网络包含多个分支结构,例如 Inception、ResNeXt 等。
- 单元结构搜索空间: 这种搜索空间