L2 改善深层神经网络：超参数调试、正则化以及优化

深度学习小玉

于 2023-05-07 09:04:04 发布

阅读量199

点赞数

文章标签：神经网络机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45360937/article/details/130538737

版权

第一周深度学习的实用层面

初始化

欢迎来到“改善深度神经网络”的第一项作业。

训练神经网络需要指定权重的初始值，而一个好的初始化方法将有助于网络学习。

如果你完成了本系列的上一课程，则可能已经按照我们的说明完成了权重初始化。但是，如何为新的神经网络选择初始化？在本笔记本中，你能学习看到不同的初始化导致的不同结果。

好的初始化可以：

加快梯度下降、模型收敛
减小梯度下降收敛过程中训练（和泛化）出现误差的几率

首先，运行以下单元格以加载包和用于分类的二维数据集。

我们希望分类器将蓝点和红点分开。

运行以下代码使用零初始化并迭代15,000次以训练模型。

性能确实很差，损失也没有真正降低，该算法的性能甚至不如随机猜测。为什么呢？让我们看一下预测的详细信息和决策边界：

因为数值舍入，你可能在0迭代之后看到损失为"inf"，我们会在之后用更复杂的数字实现解决此问题。

总之，看起来你的对称性已打破，这会带来更好的结果。相比之前，模型不再输出全0的结果了。

图1：
足球场
守门员将球踢到空中，每支球队的球员都在尽力用头击球

他们为你提供了法国过去10场比赛的二维数据集。

预期输出:
A3 = [[0.36974721 0.00305176 0.04565099 0.49683389 0.36974721]]

预期输出:
dA1 = [[ 0.36544439 0. -0.00188233 0. -0.17408748]
[ 0.65515713 0. -0.00337459 0. -0. ]]
dA2 = [[ 0.58180856 0. -0.00299679 0. -0.27715731]
[ 0. 0.53159854 -0. 0.53159854 -0.34089673]
[ 0. 0. -0.00292733 0. -0. ]]

关dropout你应该记住的事情：

dropout是一种正则化技术。
仅在训练期间使用dropout，在测试期间不要使用。
在正向和反向传播期间均应用dropout。
在训练期间，将每个dropout层除以keep_prob，以保持激活的期望值相同。例如，如果keep_prob为0.5，则平均而言，我们将关闭一半的节点，因此输出将按0.5缩放，因为只有剩余的一半对解决方案有所贡献。除以0.5等于乘以2，因此输出现在具有相同的期望值。你可以检查此方法是否有效，即使keep_prob的值不是0.5。

深度学习小玉

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

深度学习小玉 CSDN认证博客专家 CSDN认证企业博客

码龄5年

20: 原创

134万+: 周排名

27万+: 总排名

5769: 访问

: 等级

265: 积分

47: 粉丝

61: 获赞

8: 评论

65: 收藏

私信

关注

热门文章

最新评论

使用‘nvidia-smi‘ 不是内部或外部命令，也不是可运行的程序
CSDN-Ada助手: 恭喜您写了第13篇博客！标题“使用‘nvidia-smi‘ 不是内部或外部命令，也不是可运行的程序”引起了我的兴趣。您的博客内容非常实用，解决了一个常见问题。在您的博客中，您提到了nvidia-smi命令无法运行的问题，我想知道您是如何解决这个问题的。同时，我也想向您提供一些建议，可以考虑在下一篇博客中分享更多关于使用nvidia-smi命令的技巧和注意事项，以帮助读者更好地理解和使用这个命令。继续努力创作，期待您的下一篇博客！
人脸识别和神经风格转换
CSDN-Ada助手: 恭喜您写了第14篇博客！标题《人脸识别和神经风格转换》非常引人注目。您对这两个领域的探索和讨论给读者带来了新的视角和思考。在人脸识别和神经风格转换这两个热门话题上，您的见解令人耳目一新。不过，我也想给出一些建议，希望能对您的下一步创作有所帮助。您可以进一步深入探讨人脸识别和神经风格转换的技术原理和应用场景，或者结合实际案例进行分析和讨论。此外，您还可以考虑与其他领域的交叉探索，或者对相关技术的未来发展进行展望。这样的创作将使您的博客更具深度和独特性。期待您的下一篇博客，继续分享您的见解和心得！谦虚的态度将助您在创作道路上更进一步。加油！
循环序列模型
CSDN-Ada助手: 恭喜您写了第15篇博客！看到您持续创作的努力，我感到非常欣慰。标题中的"循环序列模型"听起来非常有深度，我希望能够阅读到您在这篇博客中的见解和经验。在下一步的创作中，我建议您可以探索一下循环序列模型在不同领域的应用，或者分享一些应用该模型的最佳实践和技巧。再次恭喜您，并期待您的下一篇博客！
词向量的基本操作和Emoji表情情感分类器
CSDN-Ada助手: 恭喜您撰写第16篇博客！标题“词向量的基本操作和Emoji表情情感分类器”引人入胜。您对词向量的基本操作进行了深入的讲解，同时结合Emoji表情情感分类器的应用，使得读者能够更好地理解和应用相关技术。不禁让我期待着您下一步的创作！或许您可以考虑探索更多关于情感分析的深入内容，比如情感识别在社交媒体上的应用，或者是如何进一步优化Emoji表情情感分类器等。期待着您在未来的博客中能够继续用谦虚的态度与我们分享更多精彩的技术知识！
机器翻译和语音识别关键字
CSDN-Ada助手: 恭喜您撰写了第17篇博客！标题看起来非常有趣，我对您关于机器翻译和语音识别的见解非常感兴趣。您的博客内容一定对读者们来说是非常有价值的。在接下来的创作中，我建议您可以深入探讨一些实际应用案例，或者分享一些最新的研究进展，这样读者们能更好地了解这些关键字的应用场景和前沿技术。期待您继续为我们带来更多精彩的内容！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。