深度神经网络—超参数调试

最新推荐文章于 2024-05-13 12:01:19 发布

哎呦-_-不错

最新推荐文章于 2024-05-13 12:01:19 发布

阅读量2.6k

点赞数 10

分类专栏：深度神经网络文章标签：新星计划超参数调试深度神经网络

本BLOG上原创文章未经本人许可，不得用于商业用途，转载请注明出处。

本文链接：https://blog.csdn.net/weixin_46649052/article/details/117231966

版权

深度神经网络需要调试的超参数（Hyperparameters）较多，包括：

$\alpha$ ：学习因子
$\beta$ ：动量梯度下降因子
$\beta_{1},\beta_{2},\epsilon$ ：Adam算法参数
layers：神经网络层数
hidden units：隐藏层神经元个数
learning rate decay：学习因子下降参数
mini-batch-size：批量训练样本包含的样本个数

上面的超参数：

$\beta$ ：动量梯度下降因子

$\beta_{1},\beta_{2},\epsilon$ ：Adam算法参数

分别对应两种不同的优化算法：动量梯度下降算法与Adam算法
动量梯度下降算法的核心思想是在每次训练时，对梯度进行指数加权平均处理，然后用得到的梯度值更新权重 $W$ 和常数项 $b$ 。对梯度进行指数加权平均，这样使得当前梯度不仅与当前方向有关，还与之前方向有关，这样处理让梯度前进方向更加平滑，保证了梯度下降的平稳性与准确性，减少振荡，能够更快达到最小值处。动量梯度下降算法过程如下：

初始时，令

最低0.47元/天解锁文章

哎呦-_-不错

关注

10
点赞
踩
38

收藏

觉得还不错? 一键收藏
25
评论
深度神经网络—超参数调试

文章目录1.如何选择与调试超参数？深度神经网络需要调试的超参数（Hyperparameters）较多，包括：α\alphaα：学习因子β\betaβ：动量梯度下降因子β1,β2,ϵ\beta_{1},\beta_{2},\epsilonβ1,β2,ϵ：Adam算法参数layers：神经网络层数hidden units：隐藏层神经元个数learning rate decay：学习因子下降参数mini-batch-size：批量训练样本包含的样本个数超参数之间也有重要性差异。通
复制链接

扫一扫

专栏目录

评论 25

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。