【cs231】反向传输与神经网络

本文详细介绍了反向传播算法在神经网络中的应用,利用链式法则计算模型梯度,优化参数。同时阐述了神经网络的基本结构,包括神经元、激活函数和全连接层,强调了激活函数在构建非线性模型中的重要性。
摘要由CSDN通过智能技术生成

反向传输

简介

上一章介绍了使用梯度下降法求目标损失函数的最小值。在神经网络模型中反向传播算法的作用就是要求出这个梯度值,从而后续用梯度下降去更新模型参数。反向传播算法从模型的输出层开始,利用函数求导的链式法则,逐层从后向前求出模型梯度。使用反向计算可以避免重复计算,从而加快计算速度。优化的对象是参数,反向传播算法是一种优化参数的方法。

在这里插入图片描述

链式法则

根据链式法则公式:

在这里插入图片描述

计算整体梯度可以求出每一个局部梯度将结果相乘。

在这里插入图片描述

上图中绿色的数字为正向计算结果,下面的红色数字为得到的局部梯度,从后往前递归地向前计算梯度。

对几种不同的门:

加法门不改变梯度,乘法门交换梯度,最大值门梯度只传递给最大值。

上述讨论的输入都是一维标量的情况,下面讨论在高维时如何对向量进行计算。

向量的计算和标量的计算是相似的,只是引入了Jacobian 矩阵用于储存梯度。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值