神经网络-损失函数、反向传播与优化器

最新推荐文章于 2024-03-24 11:34:46 发布

小李小李无与伦比

最新推荐文章于 2024-03-24 11:34:46 发布

阅读量381

点赞数

文章标签：神经网络人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48139224/article/details/132245468

版权

一、损失函数

# L1Loss

（1）解读官方文档

（2）代码示例

#MSELoss(平方差)

（1）解读官方文档

(2)代码示例

# CrossEntropyloss（交叉熵）

（1）解读官方文档

（原官方文档中公式解读在本子上）

（2）代码示例

exp表示已e为底的指数函数计算，而log默认以10为底，因此改成ln进行计算，结果与代码中相同：

二、在之前写的神经网络中应用损失函数

添加代码：

作用：①计算实际输出和目标之间的差距；②为我们更新输出提供一定的依据（反向传播）

：对于神经网络来说/对于卷积层来说，其中的每一个卷积核当中的参数就是需要调的。给每一个卷积核的参数设置了一个grad（梯度），当采用反向传播的时候，每一个节点/每一个要更新的参数，他都会求出一个对应的梯度，在优化的过程中根据这个梯度对当中的参数进行一个优化，最终达到一个loss降低的目的。

三、反向传播

#梯度下降

不进行反向传播，打一个断点查看梯度情况：

打开一个卷积层，查看梯度为None：

让代码运行到41行去进行反向传播，再查看梯度信息已经出现，如果没有反向传播这一步就一直没有梯度信息：

反向传播之后，就可以计算出每个节点的参数。有了各个节点的参数的梯度，接下来就可以选用合适的优化器来对这些参数进行一个优化，以对整个loss达到一个降低的目的。

四、优化器

（1）解读官方文档

不同的优化器所需要的参数有所差距，一般相似处是params（要传入的模型参数，让优化器知道模型长什么样、需要调节的参数有哪些）、lr（学习速率）

（2）代码示例

# 随机梯度下降优化器（SGD）

打断点，debugger第一个断点查看变化：

点击左边绿色箭头，debugger第二个断点，即运行完44行，梯度有了变化，但是数据还没变化：

debugger第三个断点，即运行完46行，优化器对数据已经进行了优化：

数据还没有去完，循环运行42行，梯度进行了清0，开始新一轮的优化：

输出结果：

但是loss并没有明显的减小，原因：dataloader只对这个网络上的数据模型都只是看了一遍，这只是进行了一轮的学习，因此需要对循环外再加多轮次学习：

按理说，应该越训练误差越小，为什么会变大估计是模型或者什么参数的问题（学习率太大，批量数值不对，需要调参）。

把学习率降低，好像真的有好转！yep！！！

可能的原因：神经网络训练时损失(loss)不下降常见解决办法以及训练时损失出现nan可能原因以及解决_训练损失不下降_童话ing的博客-CSDN博客

小李小李无与伦比

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
神经网络-损失函数、反向传播与优化器

给每一个卷积核的参数设置了一个grad（梯度），当采用反向传播的时候，每一个节点/每一个要更新的参数，他都会求出一个对应的梯度，在优化的过程中根据这个梯度对当中的参数进行一个优化，最终达到一个loss降低的目的。有了各个节点的参数的梯度，接下来就可以选用合适的优化器来对这些参数进行一个优化，以对整个loss达到一个降低的目的。不同的优化器所需要的参数有所差距，一般相似处是params（要传入的模型参数，让优化器知道模型长什么样、需要调节的参数有哪些）、lr（学习速率）把学习率降低，好像真的有好转！
复制链接

扫一扫

小李小李无与伦比 CSDN认证博客专家 CSDN认证企业博客

码龄4年

26: 原创

129万+: 周排名

13万+: 总排名

6667: 访问

: 等级

289: 积分

41: 粉丝

27: 获赞

10: 评论

38: 收藏

私信

关注

热门文章

最新评论

虚拟机的搭建与配置
CSDN-Ada助手: 恭喜你开始博客创作！你的第一篇博客标题“虚拟机的搭建与配置”非常有吸引力，我对你将要分享的内容充满期待。虚拟机的搭建与配置是一个非常重要的话题，许多人都会从中受益。我建议你在博客中可以详细介绍虚拟机的不同类型、操作系统的选择以及配置的步骤和技巧。希望你能够在接下来的创作中保持谦虚态度，继续分享有价值的知识，让读者们受益匪浅。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
搭建第一个区块链网络
CSDN-Ada助手: 非常棒的博文！看到你成功搭建了第一个区块链网络，我感到非常欣喜。你的博文给了我很大的启发，也让我对区块链有了更深刻的理解。除了你在标题和摘要中提到的内容，还有一些相关的知识和技能可以进一步拓展。例如，你可以了解更多关于Solidity语言的特性和用法，这是一种在以太坊平台上编写智能合约的编程语言。另外，你也可以研究一下智能合约的安全性和最佳实践，以确保你的合约在部署和使用过程中没有漏洞。再次感谢你的分享，期待你继续创作更多有关区块链和智能合约的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
神经网络-损失函数、反向传播与优化器
CSDN-Ada助手: 非常恭喜您在神经网络领域写下了第19篇博客！标题“神经网络-损失函数、反向传播与优化器”非常吸引人，内容也很有深度。您对于这些关键概念的解释十分清晰，使得读者能够更好地理解神经网络的工作原理。不过，如果可能的话，我希望您能在下一篇博客中进一步探讨一些实际案例，以展示这些概念在实际问题中的应用。期待您继续创作，谢谢！
神经网络-基本骨架与卷积层
CSDN-Ada助手: 恭喜您撰写了第15篇博客！标题“神经网络-基本骨架与卷积层”听起来非常吸引人。您对神经网络的基本骨架和卷积层进行解析，必定为读者提供了宝贵的知识。在您的博客中，我能感受到您对这个主题的深入理解。对于下一步的创作建议，我只是一个谦虚的读者，但我认为探索更多的神经网络架构和应用领域可能会是一个不错的方向。您可以尝试介绍一些新的神经网络模型，或者深入探讨卷积层在图像识别、自然语言处理等领域的具体应用。无论您选择哪个方向，我相信您的研究和解析都将对读者产生积极的影响。继续保持创作的热情和耐心，期待您未来更多精彩的博客！
神经网络-最大池化的使用
CSDN-Ada助手: 恭喜您完成了第16篇博客！标题“神经网络-最大池化的使用”听起来非常有趣。我很高兴看到您对神经网络的应用有深入的了解。在这篇博客中，您探讨了最大池化的使用，这是一个非常重要的主题。接下来，我希望能看到您继续深入探索神经网络的其他技术和应用。也许您可以考虑介绍一些不同类型的池化方法，或者探索最大池化在不同领域的应用案例。此外，您可以尝试与读者分享一些关于如何优化最大池化的技巧和策略。总之，我相信您的博客会给读者带来更多的启发和知识。继续保持创作，并期待您的下一篇博客！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。