Improving Deep Neural Network —— 第三周

最新推荐文章于 2022-05-16 21:32:58 发布

pia君

最新推荐文章于 2022-05-16 21:32:58 发布

阅读量124

点赞数

分类专栏： deeplearning.ai 笔记及课后作业分享

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43477550/article/details/103890770

版权

deeplearning.ai 笔记及课后作业分享专栏收录该内容

9 篇文章 0 订阅

订阅专栏

超参数调试
优先级

使用随机取值，而不是网格调参，因为随机取值能够探究更多重要参数的潜在值。
精确搜索：从粗到细的探索过程。Coarse to find.
使用对数标尺搜索超参数

原因：当β接近于1时，结果会对细微的变化变得很敏感，beta从0.999变为0.9995时，T就从1000变为2000。
batch norm
归一化每一层的z。

γ和β的作用是改变平均值和方差。
在使用BN时，参数b^[l]可以去掉，因为 z=wa+b, μ也会存在+b,在计算z_norm时，归一化会把b消除，b没有任何作用.

batch norm 的作用：限制了在前层的参数更新会影响的数值分布的程度，即减少了输入值的分布改变的问题，避免convariate shift。归一化固定了均值和方差，使得输入值的变化减小，减少了层与层之间的联系，使每层训练更加独立，使得后层的学习变得更加容易。

增大batch_size会减小正则化。
batch norm可以起到轻微正则化的作用。
在这里插入图片描述
测试集使用的μ和σ²是通过训练集进行估算的，通常的方法为指数加权平均。

softmax
softmax函数输出的是各个类别可能性的概率，对应的hardmax输出的是对应类别的0/1向量，如第二类就是[0 1 0 0]。

梯度下降
dZ^[L]=A-Y

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Improving Deep Neural Network —— 第三周

超参数调试优先级
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。