【cs231】反向传输与神经网络

最新推荐文章于 2024-04-27 09:48:52 发布

菜鸡学习记录

最新推荐文章于 2024-04-27 09:48:52 发布

阅读量231

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41672274/article/details/107263776

版权

本文详细介绍了反向传播算法在神经网络中的应用，利用链式法则计算模型梯度，优化参数。同时阐述了神经网络的基本结构，包括神经元、激活函数和全连接层，强调了激活函数在构建非线性模型中的重要性。

摘要由CSDN通过智能技术生成

文章目录

反向传输
神经网络

反向传输

简介

上一章介绍了使用梯度下降法求目标损失函数的最小值。在神经网络模型中反向传播算法的作用就是要求出这个梯度值，从而后续用梯度下降去更新模型参数。反向传播算法从模型的输出层开始，利用函数求导的链式法则，逐层从后向前求出模型梯度。使用反向计算可以避免重复计算，从而加快计算速度。优化的对象是参数，反向传播算法是一种优化参数的方法。

在这里插入图片描述

链式法则

根据链式法则公式：

在这里插入图片描述

计算整体梯度可以求出每一个局部梯度将结果相乘。

在这里插入图片描述

上图中绿色的数字为正向计算结果，下面的红色数字为得到的局部梯度，从后往前递归地向前计算梯度。

对几种不同的门：

加法门不改变梯度，乘法门交换梯度，最大值门梯度只传递给最大值。

上述讨论的输入都是一维标量的情况，下面讨论在高维时如何对向量进行计算。

向量的计算和标量的计算是相似的，只是引入了Jacobian 矩阵用于储存梯度。

最低0.47元/天解锁文章

菜鸡学习记录

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【cs231】反向传输与神经网络

文章目录反向传输简介链式法则小结神经网络简介神经元激活函数全连接层反向传输简介上一章介绍了使用梯度下降法求目标损失函数的最小值。在神经网络模型中反向传播算法的作用就是要求出这个梯度值，从而后续用梯度下降去更新模型参数。反向传播算法从模型的输出层开始，利用函数求导的链式法则，逐层从后向前求出模型梯度。使用反向计算可以避免重复计算，从而加快计算速度。优化的对象是参数，反向传播算法是一种优化参数的方法。链式法则根据链式法则公式：计算整体梯度可以求出每一个局部梯度将结果相乘。上图中绿色的数字为正
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。