深度学习重要基础知识（踩过的坑）

ZHU～.

已于 2023-09-05 19:44:54 修改

阅读量193

点赞数 1

文章标签：深度学习人工智能

于 2023-07-27 21:30:50 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZHUhapi/article/details/131968867

版权

1、损失（loss）和权重（w）的关系

loss表示预测值和真实值的误差，主要用于对权重w的更新。

loss通常由损失函数得到，损失函数常见的由MSE均方误差和CorssEnropy交叉熵损失函数。

MSE均方误差：

该误差（loss）使用的计算公式为MSE

下图可以看清误差是如何反向传播的：

得到loss后，可带入权重w更新的公式中：

这里使用的是SGD随机梯度下降法，此外还有Adam等权重更新方法

式中，loss为中的一部分，中的，表示参数w5对误差的贡献。n为学习率，代入loss后可对权重值w5进行更新，若loss越大，即结果和真实值差距越大，则w5变化越大。

若想理解整个过程，可参考(146条消息) 神经网络中的反向传播法算法推导及matlab代码实现_matlab反向传播算法_南极粥的博客-CSDN博客

2、激活函数的作用

经过激活函数sigmoid、Relu等非线性函数后，网络就变成了一个由许多非线性输入组成的能够近似模拟任何曲线的复杂函数，这个曲线能够近似拟合你所给的数据。

3、zero_grad清零梯度

使用在反向传播前，将上次记录的反向传播的梯度清零，否则梯度会进行叠加。

4、Batch Normalization的作用对象

在batch维度上计算相同通道上的均值和方差，再利用相同batch维度上的均值和方差做标准化。

图片来自Batch Normalization详解（原理+实验分析）_batchnormalization_macan_dct的博客-CSDN博客

nn.BatchNorm1d(channel_num)：参数为输入的通道数（卷积核数目），1d对应1d卷积的输入数据格式，2d为2d卷积的输入数据格式。

维度分别为：

1d:（batch，C卷积核个数，times）

2d:（batch，C卷积核个数，times，channel（数据自身的）通道数）

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习重要基础知识（踩过的坑）

表示参数w5对误差的贡献。n为学习率，代入loss后可对权重值w5进行更新，若loss越大，即结果和真实值差距越大，则w5变化越大。loss通常由损失函数得到，损失函数常见的由MSE均方误差和CorssEnropy交叉熵损失函数。这里使用的是SGD随机梯度下降法，此外还有Adam等权重更新方法。该误差（loss）使用的计算公式为MSE。若想理解整个过程，可参考。
复制链接

扫一扫

ZHU～. CSDN认证博客专家 CSDN认证企业博客

码龄4年

19: 原创

117万+: 周排名

5万+: 总排名

3万+: 访问

: 等级

589: 积分

147: 粉丝

257: 获赞

13: 评论

635: 收藏

私信

关注

热门文章

最新评论

C++学习笔记：油管博主Cherno
CSDN-Ada助手: 恭喜您完成了第16篇博客！很高兴看到您在学习C++的过程中能够分享自己的心得体会。油管博主Cherno的视频确实是一个很好的学习资源，希望您可以继续保持学习的热情，不断总结经验，分享给更多的读者。或许下一步您可以尝试结合实际项目或者编程练习，给读者展示更多实用的技术应用，让大家更好地理解和掌握C++编程。期待您的下一篇作品！
设备树的引入和内核对设备树的处理
CSDN-Ada助手: 恭喜您发布了第17篇博客！标题“设备树的引入和内核对设备树的处理”非常吸引人，内容也相当有深度。希望您能继续保持创作的热情和耐心，不断分享您的见解和经验。或许下一步可以探讨一些实际案例，或者结合其他技术领域进行深入探讨，相信会更加丰富您的博客内容。期待您更多精彩的作品！愿您在创作的道路上越走越远，不断进步！祝您一切顺利！
FreeRTOS基本介绍、列表、移植、值得注意的点
CSDN-Ada助手: 恭喜您发布了第14篇博客，内容涵盖了FreeRTOS的基本介绍、列表、移植以及值得注意的点，非常详尽和有用。在阅读您的博客后，我对FreeRTOS有了更深入的了解。希望您能继续坚持创作，分享更多有关嵌入式系统和RTOS的知识。或许下一步可以探讨一些实际的应用案例或者深入分析FreeRTOS的源码实现，让读者更加深入地理解这个主题。期待您的下一篇文章！
Linux驱动进化：传统模型、设备总线驱动模型、设备树
CSDN-Ada助手: 恭喜您撰写了第15篇博客，内容涉及Linux驱动进化的不同模型，阐述了传统模型、设备总线驱动模型和设备树的特点。对于这个技术领域的深入研究和分享，我表示由衷的感谢。在未来的创作中，或许可以考虑深入探讨每种驱动模型的优缺点，以及在实际应用中的具体场景和案例。期待您的下一篇作品！
Linux多进程、线程间通信：共享内存、信号量、管道、互斥锁
CSDN-Ada助手: 推荐算法技能树：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。