深度学习的梯度下降法

先锋小牛

已于 2022-04-27 21:28:32 修改

阅读量1.5k

点赞数

文章标签：深度学习 tensorflow

于 2022-04-27 11:08:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/niu2212035673/article/details/124445661

版权

tensorFlow 专栏收录该内容

4 篇文章

订阅专栏

本文深入探讨了梯度下降法在最优化问题中的应用，包括一维和多维情况下的公式，以及与哈密顿算子的联系。还介绍了回归分析中的代价函数和学习数据，重点讲解了误差反向传播在神经网络中的作用，以及神经单元误差的递推关系。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

梯度下降法

哈密顿算子

最优化问题和回归分析

学习数据和正解

误差反向传播法

神经单元误差

梯度下降法

梯度下降法是一种寻找最小值的点的方法，在数值分析领域，梯度下降法也称最速下降法

近似公式

表示为两个向量的内积形式

向量a,b的内积为 $a\cdot b = |a||b|cos\theta$ ， $\theta$ 为180时内积的值最小，可得向量a满足以下条件式时，内积 $a\cdot b$ 取最小值

两个变量函数的梯度下降法的基本式子

函数z = f(x, y)，当x改变 $\Delta x$ ，当y改变时 $\Delta y$ ，函数 f(x, y)的变化 $\Delta z$ 为下式

当两个向量的方向相反时 $\Delta z$ 最小。

即梯度下降的基本公式

梯度下降法及用法

当有多个变量时，梯度下降法基本公式如下为函数f在点 $(x_{1},x_{2}\cdots x_{n})$ 的梯度为

点 $(x_{1},x_{2}\cdots x_{n})$ 向点移动就能以最快的速度移动，因此反复依照计算梯度，并按梯度移动就能找到最小值点

哈密顿算子

梯度下降法基本公式也可由哈密顿算子表示

也可以表示成

32， $\eta$ 的含义

可以看成函数移动的步长，在神经网络中称为学习率

最优化问题和回归分析

一元线性回归方程

p称为回归系数，q称为截距

代价函数

在最优化方面，误差总和 $C_{T}$ 也可以称为代价函数

学习数据和正解

利用事先提供的数据来确定权重和偏置，在神经网络中称为学习

误差反向传播法

代价函数计算量大，无法直接使用梯度下降法时，引入误差反向传播法

普通的计算方法：先代入数据，然后计算偏导

误差反向传播法：先计算偏导，然后代入数据，减少了大量的偏导计算过程

神经单元误差 $\delta _{j}^{l}$

引入误差反向传播法的特点是将繁琐的导数计算替换为数列的递推关系式，提供这些递推关系式的就是神经单元误差

权重，偏置的偏导数和的关系

$\delta _{j}^{l}$ 的计算方法

将 $\delta _{j}^{l}$ 看作数列，得到末项的计算公式

层L与下一层L+1的值的关系式

博客等级

码龄9年

85
原创

296
点赞

1184
收藏

540
粉丝

关注

私信

热门文章

分类专栏

最新评论

OSG和Qt结合
multifacer: 一片白，模型没出来啊，谢谢楼主解答
OPenGL--Transform feedback示例解析
煤老板不卖煤: 想问一下博主，文章末尾有提到能查询到图元的数量，那有什么办法能获取到每个图元的顶点数量呢？因为有可能出现每个图元中获取到的顶点数不固定的情况，感谢！
OSG和Qt结合
小星星·: 老哥，我有点不理解。osgViewer::GraphicsWindowEmbedded怎么和QOpenGLWidget结合的？
常见的损失函数
weixin_45977006: 您好，楼主总结的很细，不过，Mean Squared Error 应该叫做均方误差损失，并非均方差损失，这俩区别很大
UE4 C++ —— UMG和C++交互
陨获: 头文件打不开，前面要加components/

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。