Improving Deep Neural Network —— 第三周

  1. 超参数调试
    优先级
    在这里插入图片描述
    使用随机取值,而不是网格调参,因为随机取值能够探究更多重要参数的潜在值。
    精确搜索:从粗到细的探索过程。Coarse to find.
  2. 使用对数标尺搜索超参数
    在这里插入图片描述
    在这里插入图片描述
    原因:当β接近于1时,结果会对细微的变化变得很敏感,beta从0.999变为0.9995时,T就从1000变为2000。
  3. batch norm
    归一化每一层的z。
    在这里插入图片描述
    γ和β的作用是改变平均值和方差。
    在使用BN时,参数b[l]可以去掉,因为 z=wa+b, μ也会存在+b,在计算z_norm时,归一化会把b消除,b没有任何作用.
    在这里插入图片描述
    在这里插入图片描述
    batch norm 的作用:限制了在前层的参数更新会影响的数值分布的程度,即减少了输入值的分布改变的问题,避免convariate shift。归一化固定了均值和方差,使得输入值的变化减小,减少了层与层之间的联系,使每层训练更加独立,使得后层的学习变得更加容易。

增大batch_size会减小正则化。
batch norm可以起到轻微正则化的作用。
在这里插入图片描述
测试集使用的μ和σ2是通过训练集进行估算的,通常的方法为指数加权平均。

  1. softmax
    softmax函数输出的是各个类别可能性的概率,对应的hardmax输出的是对应类别的0/1向量,如第二类就是[0 1 0 0]。
    在这里插入图片描述
    梯度下降在这里插入图片描述
    dZ[L]=A-Y
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值