机器学习基础学习-关于反向传播算法的一些记录

最新推荐文章于 2024-09-14 20:23:55 发布

小夭。

最新推荐文章于 2024-09-14 20:23:55 发布

阅读量1k

点赞数

分类专栏：深度学习机器学习文章标签：机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_47146037/article/details/123627978

版权

机器学习同时被 2 个专栏收录

25 篇文章 9 订阅

订阅专栏

10 篇文章 2 订阅

订阅专栏

梯度下降与随机梯度下降

我们期望代价函数尽可能的小，但实际情况下我们不能直接通过数学解解除对应的最小值，于是产生了我们的梯度下降法求代价函数的最小值，相关概念可以看前面的博客
在这里插入图片描述
将代价函数看做两个维度上的更改，那么代价函数引起的变化，是由v1、v2引起的

将两个维度上的变化写成向量的形式
在这里插入图片描述

我们希望代价函数尽可能小，所以这里代价函数的变化我们期望为负值，我们取

因此可以得到代价函数的变化

恒为负数。

进而进行梯度下降的过程
在这里插入图片描述

随机梯度下降

我们期望以部分样本代价函数的平均来估计所有样本代价函数的平均
在这里插入图片描述

反向传播算法

上面的梯度下降的过程描述了如何求代价函数最小的过程，其中梯度下降的过程我们需要知道梯度是多少，而梯度的求法就是我们的反向传播算法。

反向传播算法可以分为正向传播和反向误差传播
在这里插入图片描述
其实这里以数学的链式求导来理解会比较好理解

假设我们的代价函数的变化是由于第l层到第l+1层的w的变化引起的，我们从代价函数开始追溯，追溯到w的变化，可以理解成链式求导的过程
在这里插入图片描述

另外补充一点，这里的误差反向传播的由来，我们可以想一下，如果代价函数是均方误差的表示，那么对第一层的激活函数求导，得到的y-a就是我们的误差，这也是误差这个叫法的由来

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。