【王树森】神经网络结构搜索 (1/3): 基本概念和随机搜索 Neural Architecture Search: Basics & Random Search(个人向笔记)

前言

  • 神经网络的参数通常指的是权重,比如全连接神经网路的权重矩阵和偏置
  • 参数需要从训练数据中学习。然后在测试数据中测试准确率
  • 参数最后的训练结果依赖于训练数据和超参数
  • 超参数是参数的初始化值,分为结构和算法,其中结构一般是卷积层有多少层,卷积核有多大等。而算法则是何种优化算法,还有batch size的大小等
    在这里插入图片描述
  • 以 CNN 的结构超参数为例:现在 CNN 很多著名的超参数结果都是人手动调出来的
    在这里插入图片描述

Neural Architecture Search(NAS)

  • 定义: 寻找使得准确率最高的神经网路结构
  • 神经网路结构的搜索空间很大,如果每一个都去算,那么计算量会大到爆炸:
    在这里插入图片描述
  • 因此我们需要选定一些候选的参数,然后从候选的参数开始试验
  • 搜索空间的大小就是这些候选参数的笛卡尔积
    在这里插入图片描述
  • NAS的结果示例如下:
    在这里插入图片描述

Baseline:Random Search

  • 随机选取超参数,然后一个个通过训练去尝试准确率:
    在这里插入图片描述
  • 但是这种方法的缺点是计算效率太低,最多只能算几万种参数,而这和搜索空间比起来实在是太小了:
    在这里插入图片描述
  • 6
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值