《动手学深度学习》第九天---正向传播，反向传播和计算图

最新推荐文章于 2024-06-01 18:03:01 发布

打着灯笼摸黑

最新推荐文章于 2024-06-01 18:03:01 发布

阅读量401

点赞数

分类专栏：《动手学深度学习》

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39594939/article/details/97611210

版权

《动手学深度学习》专栏收录该内容

37 篇文章 46 订阅

订阅专栏

详见《动手学深度学习》

（一）正向传播（forward propagation）

正向传播是指对神经网络沿着从输入层到输出层的顺序，依次计算并存储模型的中间变量（包括输出）。
Frobenius 范数，简称F-范数，是一种矩阵范数，记为||·||F。矩阵A的Frobenius范数定义为矩阵A各项元素的绝对值平方的总和。矩阵的F范数和向量的L2范数类似。
得到正向传播的目标函数：
J = L + s，其中 L = （o，y）
在这里插入图片描述

（二）反向传播

反向传播依据微积分中的链式法则，沿着从输出层到输入层的顺序，依次计算并存储目标函数有关神经网络各层的中间变量以及参数的梯度。
主要利用了两条线，一是s对于w(1)和w(2)的梯度，而是L对于o,o对于h，h对于z，z对于x的梯度计算。
最后得到
在这里插入图片描述

（三）训练深度学习模型

在训练深度学习模型时，正向传播和反向传播之间相互依赖。在模型参数初始化完成后，我们交替地进行正向传播和反向传播，并根据反向传播计算的梯度迭代模型参数。这个复用也导致正向传播结束后不能立即释放中间变量内存。这也是训练要比预测占用更多内存的一个重要原因。

打着灯笼摸黑 CSDN认证博客专家 CSDN认证企业博客

码龄7年

104: 原创

23万+: 周排名

175万+: 总排名

26万+: 访问

: 等级

3005: 积分

326: 粉丝

308: 获赞

106: 评论

2391: 收藏

私信

关注

热门文章

分类专栏

最新评论

论文阅读笔记(16)---2022 CVPR Geometric Transformer for Fast and Robust Point Cloud Registration
weixin_58339251: 博主，请问你训练过geotransformer的模型吗？，我使用预训练的权重跑的效果确实不错，但我在自己训练时遇到了一个问题：几个数据集的config文件中的batchsize都=1，这样训练的速度特别慢几乎不能接受。当我调高batchsize时会报一个语法错误：list没有属于tensor的detach方法。所以我去官网看发现了同样的问题，作者回应目前代码batchsize只能设置为1，只能通过ddp来提高速度，请问您是怎么解决的？
传统图像去噪方法（二）之引导滤波
染予: 您好博主，我用你的代码试着做终端输入,底下是我的代码路径输入： python load_display_save.py D:\\images\\000.JPG 结果：: can't open file 'load_display_save.py': [Errno 2] No such file or directory 。是我文件路径的问题吗，我把jpg换成小写还是有问题
AR人脸图像集获取并分类
星灵探机: 请问首张截图是出自哪篇中文文献呢
传统图像去噪方法（三）之非局部均值去噪（NLM）
舒肤佳好难啊: R1=NLmeansfilter(I,I, sigma, 5, 11) # 自定义去噪没有对带噪声图片操作啊
python实现传统的TV正则去噪
QDDD_OUCer: 你好，请问原论文是哪篇呀？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。