基本的gradient descent梯度下降法

最新推荐文章于 2023-05-21 16:48:02 发布

qilin2016

最新推荐文章于 2023-05-21 16:48:02 发布

阅读量1.1k

点赞数 1

分类专栏： Deep Learning Machine Learning 文章标签：机器学习深度学习神经网络

Machine Learning 同时被 2 个专栏收录

9 篇文章 2 订阅

订阅专栏

Deep Learning

2 篇文章 0 订阅

订阅专栏

图片来自Coursera的 Machine Learning 课件。

相关资料：

这里是Andrew Ng的课程视频：https://www.coursera.org/learn/machine-learning/home/welcome

梯度下降是其中第十周的内容。

一份很好的梯度下降优化算法的资料：http://sebastianruder.com/optimizing-gradient-descent/ （有时间我会将它完整翻译）

1. Batch gradient descent 是将所有 m个样本全部用来计算gradient，取平均之后再迭代参数。该算法计算量随m的增大而迅速增大。

其中损失函数Loss function是系统输出误差的均方值，将它对参数求导就得到了第二行公式的最后一项，多出来的x一项是由h函数的具体形式决定的，这里h=\theta * x 所以只有x的一次项。

2. Stochastic gradient descent 一次只用一个样本来计算gradient，之后直接迭代参数。一次只用一个样本点会使得一次的descent方向不一定是最速下降的方向，但是计算速度快。

3. Mini-batch gradient descent 一次只用 b个样本来计算gradient，将b个gradient取平均之后迭代参数。

下面的动画是几种不同算法优化过程：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qilin2016

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

利用基本梯度下降法和牛顿法对样本进行判别

山高路远坑很深的博客

04-18

1430

机器学习实验五，详情请参考《模式分类》第二版第五章课后上机练习5.4节实验环境：Matlab 2016a基本梯度下降法和牛顿法：我们在寻找能将两类类别分开的权向量时采用的方法是：定义一个准则函数J（a），当a是解向量时，J（a）最小。这样就将问题简化为一个标量函数的极小化问题——通常可以用梯度下降法来解决。梯度下降法的原理非常简单，首先从一个任意选择的权向量a（1）开始，计算其梯度向量，下一个值a（

深度学习优化函数详解（1）-- Gradient Descent 梯度下降法

史丹利复合田的博客

07-23

1万+

深度学习优化函数详解系列目录 深度学习优化函数详解（0）– 线性回归问题 深度学习优化函数详解（1）– Gradient Descent 梯度下降法 深度学习优化函数详解（2）– SGD 随机梯度下降 深度学习优化函数详解（3）– mini-batch SGD 小批量随机梯度下降 深度学习优化函数详解（4）– momentum 动量法 深度学习优化函数详解（5）– Neste...

参与评论您还未登录，请先登录后发表或查看评论

Gradient Descent(梯度下降法)

ws_6868的博客

01-31

400

默认你已经了解了导数，偏导，梯度和方向导数的概念直观理解比如我们在一座大山上的某处位置，这时候突然阴云密布，我们想要快速的下山，但是我们不知道怎么下山，于是决定走一步算一步，可是怎么走一步算一步呢？有种方法是这样我们先环顾下四周（360度）看一下哪里山坡最陡，然后向最陡峭的地方走一步，一致重复这个过程，按照这个方法一直到走到最低点（这个最低点事局部最优，因为按照这种方法我们是...

GradientDescent（梯度下降）算法的理解

猫ER

02-21

807

公式：公式解释：用w减去其目标函数对w求得的偏导数乘以一个常数，之后所得到的新值再次赋值给w 上面的这个凸函数是一个二次函数，在点w处求得其梯度，也就是该点的导数值，该点的导数值表示该点下降的快，还是慢，它形容的是一个程度，是一个比重，不是一个具体的大小长短，类似于一个百分比，5%或者150%。那么如何让它变得有大小长短呢，那就给他一个单位距离，也就是步长也就是公式中乘上的。如果导数值很...

强化学习笔记之gradient ascent（二）

u012680687的博客

04-13

4511

一般而言，Actor的策略就是gradient ascent Actor和Environment、Reward的关系如下：在一个回合episode中，这些state和action组成一条轨迹： Trajectory τ={s1,a1,s2,a2,…,sT,aT} \textbf {Trajectory} \space \tau = \lbrace s_1,a_1,s_2,a_2,\d...

梯度上升和梯度下降

weixin_44943389的博客

05-21

2197

梯度下降：梯度下降是一种迭代算法，用于寻找函数的局部最小值或全局最小值。在梯度上升和梯度下降算法中，梯度指的是目标函数关于参数或变量的偏导数向量。为了解决这个问题，可以采用不同的变体和改进算法，如随机梯度上升、随机梯度下降、批量梯度下降、动量法、自适应学习率等。梯度上升（Gradient Ascent）和梯度下降（Gradient Descent）是优化算法中常用的两种方法，用于寻找函数的最大值和最小值。梯度上升和梯度下降是优化算法中常用且重要的方法，它们为许多机器学习和深度学习模型的训练提供了基础。

MATLAB实现梯度下降算法(gradient descent)，案例丰富【数学建模、科学计算算法】.zip

04-24

4. **科研数据分析**：在数据分析中，梯度下降可以帮助我们找到最佳拟合模型，比如在回归分析中，通过梯度下降法调整模型参数，使得预测误差最小化。MATLAB的统计和机器学习工具箱包含了许多预定义的模型，但自定义...

PSO.zip_engine77x_gradient descent_pso 梯度下降_梯度下降法_梯度下降法 pso

09-20

梯度下降法是最早最简单，也是最为常用的最优化方法。梯度下降法实现简单，当目标函数是凸函数时，梯度下降法的解是全局解。一般情况下，其解不保证是全局最优解，梯度下降法的速度也未必是最快的。梯度下降法的优化...

BPgaijin.rar_gradient descent_gradient descent bp_动量梯度算法_动量梯度下降

07-14

采用动量梯度下降算法训练BP网络,有需要的下哦~

examples_ABC_gradientdescent_梯度下降法_凸优化_

09-29

在机器学习问题中，很多的算法归根到底就是在求解一个优化问题，然而我们的现实生活中也存在着很多的优化问题，例如道路上最优路径的选择，商品买卖中的最大利润...如基本的梯度下降法，牛顿法以及启发式的优化算法(PSO

梯度下降法(Gradient descent)

moverzp的博客

03-13

1万+

梯度下降法(Gradient descent)标签： 机器学习1.梯度下降法有什么用梯度下降法用来求函数的极小值，且是一种迭代算法，由于计算效率高，在机器学习中常常使用。梯度下降法经常求凸函数(convex function)的极小值，因为凸函数只有一个极小值，使用梯度下降法求得的极小值就是最小值。与其对应的有梯度上升法(Gradient ascent)，用来求函数的极大值，两种方法原理一样，只是计

机器学习--梯度下降法（Gradient Descent）

YGQ_qq_1435471912

01-23

2323

目录1.概述2.梯度下降法2.1场景假设 1.概述 2.梯度下降法 2.1场景假设

梯度下降法基本原理

liumingchun13的博客

08-18

1843

梯度下降法是一个一阶最优化算法，通常也称为最速下降法。我之前也没有关注过这类算法。最近，听斯坦福大学的机器学习课程时，碰到了用梯度下降算法求解线性回归问题，于是看了看这类算法的思想。今天只写了一些入门级的知识。我们知道，函数的曲线如下：编程实现：c++ code[cpp] view plain copy print?/* * @author:郑海波 * blog.csdn.net/nuptbo

优化算法之——最速下降法

热门推荐

yh的博客

03-15

7万+

引言：在解决无约束问题时，经常用到的一类算法是最速下降法，在求解机器学习算法的模型参数，即无约束优化问题时，梯度下降（Gradient Descent）是最常采用的方法之一，另一种常用的方法是最小二乘法。在求解损失函数的最小值时，可以通过梯度下降法来一步步的迭代求解，得到最小化的损失函数和模型参数值。反过来，如果我们需要求解损失函数的最大值，这时就需要用梯度上升法来迭代了。在机器学习中，基于基本的...

通俗理解-梯度下降法（一）- 数学基础

refuil的博客

02-26

7638

什么是梯度下降 梯度下降法（gradient descent）是一种常见的一阶（first-order）优化方法，是求解无约束优化问题最简单、最经典的方法之一。所谓的一阶方法就是仅使用目标函数的一阶导数，不利用其高阶导数。那什么是无约束优化问题呢？举个例子，在一元函数法f(x)的图像中，求无约束最优化问题，即不对定义域或值域做任何限制的情况下，求解函数f(x)的最小值。没有理解，没事儿，本...

常见的几种最优化方法（梯度下降法、牛顿法、拟牛顿法、共轭梯度法等）

lmx的博客

07-25

1万+

常见的几种最优化方法（梯度下降法，牛顿法，拟牛顿法，共轭梯度法等）我们每个人都会在我们的生活或者工作中遇到各种各样的最优化问题，比如每个企业和个人都要考虑的一个问题“在一定成本下，如何使利润最大化”等。最优化方法是一种数学方法，它是研究在给定约束之下如何寻求某些因素（的量），以使某一（或某些）指标达到最优的一些学科的总称。随着学习的深入，博主越来越发现最优化方法的重要性，学习和工作中遇到的大多...

机器学习入门系列04，Gradient Descent（梯度下降法）

yofer张耀琦的专栏

03-27

3万+

什么是梯度下降法？学习速率的引入；如何调整学习速率；Adagrad算法介绍；用泰勒展开式对梯度下降法进行数学理论支持

梯度下降优化算法综述

null的专栏

04-14

5万+

本文翻译自Sebastian Ruder的“An overview of gradient descent optimization algoritms”，作者首先在其博客中发表了这篇文章，其博客地址为：An overview of gradient descent optimization algoritms，之后，作者将其整理完放在了arxiv中，其地址为：An overview of grad

梯度下降-最小二乘-scipy使用

qq_41103204的博客

04-12

2045

目录1 概念2 区别3 scipy.optimize的使用 1 概念最小二乘法：最小二乘法（又称最小平方法，Least squares）是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据，并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。 ...

适应梯度下降法（Adaptive Gradient Descent，AdaGrad）简单介绍