NNDL 作业5

最新推荐文章于 2024-09-14 09:59:20 发布

CikL160

最新推荐文章于 2024-09-14 09:59:20 发布

阅读量82

点赞数 1

分类专栏：作业文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_63316615/article/details/134092899

版权

作业专栏收录该内容

13 篇文章 0 订阅

订阅专栏

习题4-1 对于一个神经元 $\sigma (w^{T}*x+b)$ ,并使用梯度下降优化参数w时，如果输入x恒大于0，其收敛速度会比零均值化的输入更慢。

零均值化会将输入x集中到0附近，对于sigmoid激活函数，它在自变量取0的时候，梯度最大。也就是说这个时候，梯度下降算法的收敛速度是最快的。输入x恒大于零，这时候梯度会比在0附近小，收敛速度相较于零均值化后的数据慢。如果换做是其它激活函数就不一定了。

习题4-5 如果限制一个神经网络的总神经元数量（不考虑输入层）为N+1，输入层大小为 $M_{0}$ ,输出层大小为1，隐藏层的层数为L，每个隐藏层的神经元数量为 $\frac{N}{L}$ ，试分析参数数量和隐藏层层数L的关系。

$params=M_{0}*\frac{N}{L}+(L-1)*\frac{N^{2}}{L^{2}}+\frac{N}{L}+(N+1)$

第一项是输入层与第一个隐藏层之间的权重参数个数，第二项是隐藏层之间的权重参数个数，第三项是隐藏层与输出层的权重参数个数，最后一项是每个神经元的偏置。

习题4-7 为什么在神经网络模型的结构化风险函数中不对偏置b进行正则化？

偏置b对函数来讲只是只是一个平移，无论是变大还是变小，对结果的贡献度也只是一个偏置。只起到偏移、微调的作用。

习题4-8 为什么在反向传播算法进行参数学习时要采用随即参数初始化的方式而不是直接令W=0，b=0?

在反向传播算法中，通过计算每一个参数对于损失值的影响，即计算偏导数。拿偏导数乘学习率或者叫步长，再更新每一个参数。没传播一遍，参数就更新一遍。然后再前向传播，计算损失，再反向传播更新参数。直到损失值最小。如果将权重和偏置都初始化为0，那么每个神经元都会重复着相同的运算，有相同的梯度，每一层参数更新都一样。就相当于隐层只有一个神经元。

习题4-9 梯度消失问题是否可以通过增加学习率来缓解？

梯度消失是指：梯度接近于零，网络中的参数更新的微乎其微甚至不更新，这样无论程序运行多久，参数就相当于没变。

通过增加学习率是无法缓解梯度消失的问题的。增大学习率，梯度接近于零，二者相乘，结果还是非常小，参数还是几乎不更新。反而会导致那些高层的梯度会发生梯度爆炸问题。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

CikL160 CSDN认证博客专家 CSDN认证企业博客

码龄3年

13: 原创

137万+: 周排名

27万+: 总排名

4744: 访问

: 等级

226: 积分

70: 粉丝

95: 获赞

7: 评论

94: 收藏

私信

关注

热门文章

分类专栏

作业 13篇

最新评论

NNDL 作业二
CSDN-Ada助手: 非常棒的博文！你对于平方损失函数和交叉熵损失函数的适用性进行了深入的分析，对于分类问题的特点以及不同评价指标的解释也很清晰。继续写博文可以帮助更多人理解这些概念。除了你提到的内容，还有一些扩展知识和技能可以与这篇博文相关。例如，你可以探讨一下正则化方法在分类问题中的应用，如L1正则化和L2正则化，它们对模型的影响以及如何选择合适的正则化参数。另外，你还可以介绍一些常用的分类模型，如逻辑回归、支持向量机等，并讨论它们在不同损失函数下的性能表现。希望你能继续写出更多有价值的博文，分享你的见解和经验，让更多人受益！谦虚地说，我相信你会有更多精彩的内容呈现给读者。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
简要介绍图中的优化算法，编程实现并2D可视化
CSDN-Ada助手: 亲爱的作者，恭喜你写了第12篇博客！你的坚持和努力让我非常钦佩。对于图中的优化算法的介绍和编程实现，你的文章写得非常清晰易懂，让我受益匪浅。不过，我想建议你在下一篇博客中，可以尝试加入一些实际案例或者应用场景，这样读者更容易将理论知识和实际应用联系起来。期待你更多的创作，加油！
NNDL 作业11 LSTM
CSDN-Ada助手: 恭喜你完成了第11篇博客！LSTM是一个复杂且具有挑战性的主题，你能够深入探讨并分享你的见解真是令人印象深刻。接下来，我建议你可以尝试探讨一些实际应用场景，或者对比不同的深度学习模型，这样可以让你的博客内容更加丰富和实用。期待你的下一篇作品！加油！
NNDL 作业6 卷积
CSDN-Ada助手: 恭喜你写了第6篇博客！标题看起来非常有趣，我期待着阅读你的博客内容。在下一步的创作中，或许你可以考虑分享一些关于卷积的实际应用案例，或者对卷积算法的一些改进和优化的探讨。希望你能继续保持创作的热情，期待你的下一篇博客！
NNDL 作业5
CSDN-Ada助手: 恭喜您写完了第5篇博客！看到您持续创作，我感到非常高兴。标题“NNDL 作业5”让我猜测这篇博客可能是关于神经网络和深度学习的内容。我希望在评论中能看到更多的细节，以便更好地理解您的观点和想法。同时，我也想提醒您，在博客中加入一些实例或案例研究，这将有助于更生动地展示您的观点。再次恭喜您，期待您未来更多精彩的创作！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。