梯度下降公式理解（为什么使用cost function的导数？）

最新推荐文章于 2024-07-09 19:51:38 发布

liuren098

最新推荐文章于 2024-07-09 19:51:38 发布

阅读量3.3k

点赞数 2

文章标签：梯度下降代价函数求导

本文链接：https://blog.csdn.net/jason_rao/article/details/81223947

版权

在gradient descent 梯度下降公式中，一般的表达都是如下：
这里写图片描述
之前没有认真思考这个公式为什么这样定义？只理解到学习率如何影响到最小值的获得。

但是学习率 α 后为什么用 θ1处的求导呢？在吴恩达的课程论坛中也看到类似的提问：
论坛链接：为什么用这个公式

有个回答很清楚，我直接贴过来了。可以看出，其实可以不必使用cost function的导数。
这里写图片描述

但是用cost fucntion求导肯定有其好处，这篇文章阐述的很清楚，如链接：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

liuren098

关注关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
梯度下降公式理解（为什么使用cost function的导数？）

在gradient descent 梯度下降公式中，一般的表达都是如下：论坛链接：为什么用这个公式
复制链接

扫一扫

吴恩达深度学习笔记（7）--逻辑回归的代价函数（Cost Function）

Harpoon_fly的博客

11-23

1540

逻辑回归的代价函数（Logistic Regression Cost Function）在上一篇文章中，我们讲了逻辑回归模型，这里，我们讲逻辑回归的代价函数（也翻译作成本函数）。吴恩达让我转达大家：这一篇有很多公式，做好准备，睁大眼睛！代价函数很重要！为什么需要代价函数：为了训练逻辑回归模型的参数 w和参数b我们，需要一个代价函数，通过训练代价函数来得到参数w和参数b 。先看一下逻辑回归...

关于梯度下降算法的理解

liang23333的博客

01-17

934

最近在看斯坦福大学的机器学习公开课，看了第二节课，看完就已经迷糊了，都没怎么看懂，然后我搜了一下那节课讲的内容，发现原来讲的是线性回归，梯度下降还有正规方程组三个概念。这里我讲一下梯度下降的理解。以一个例子来说明，给定一组x0,x1还有y，我们要求一个函数h(x）=w0x0+w1x1；求出两个参数w0，w1,使之拟合的更好。然后就有一个loss function ，这个拟合的更好，

参与评论您还未登录，请先登录后发表或查看评论

梯度下降（Gradient Descent）

最新发布

uhkj86的博客

07-09

573

梯度下降（Gradient Descent）是一种优化算法，广泛用于求解机器学习和深度学习中的最小化问题，特别是在参数学习和模型训练中。其基本思想是通过迭代的方式，逐步调整参数以最小化目标函数（如损失函数或成本函数）。下面详细解释梯度下降的核心概念、工作原理以及应用。

为啥要使用梯度下降法

songhuangong123的博客

06-21

279

求最大值最小值的两种主流方法：将导致设置为0当然是最简单的方法，但是有时求导之后，没法发保证左边只包含w，而右边不包含的情况，此时需要使用梯度下降法。先随便给一个w的初始值，然后根据导函数，一步步的迭代，直到w收敛。此时w的对应的f(w)值也越来越趋近最小值！...

还不了解梯度下降法？看完这篇就懂了！

木东居士

11-28

909

0x00 前言：机器学习方法论在此之前，我们已经学习了分类算法：kNN算法，回归算法：线性回归。我们知道：机器学习就是需找一种函数f(x)并进行优化，且这种函数能够做预测、分类、生成...

为什么梯度下降是有效的？

JingYi的专栏

12-20

3501

在机器学习的很多模型中都用到了梯度下降法或者基于梯度下降的改进算法，那么究竟梯度下降法是如何保证算法的正确性或者说它是有效的呢？接下来，本文将简单分析这个问题。1. 直观认识以线性回归为例，这里定义了代价函数如下：我们训练模型的目的就是求得一组解θ0, θ1使得代价函数J最小，其中θ0, θ1与代价函数J的函数图像大致如下图所示：为了找到...

梯度下降演算法.zip

08-25

批量梯度下降每次迭代使用所有训练样本计算梯度；随机梯度下降则只用一个样本计算梯度，更新速度快但可能会有较大波动；小批量梯度下降介于两者之间，通常能取得较好的平衡。在神经网络中，梯度下降被用于反向传播...

求解逻辑回归—-梯度下降

12-21

在逻辑回归中，我们通常使用梯度下降来更新模型的权重，以逐步减小代价函数（cost function），这个代价函数通常选择交叉熵损失函数。【sigmoid函数】在逻辑回归中起到关键作用，它是S型函数，能够将任何实数值...

线性回归及梯度下降_20170509

05-09

在单变量线性回归中，梯度下降的目标是最小化Cost Function \( J(\theta_0, \theta_1) \)。梯度下降的基本思想是从随机起点开始，沿着梯度（或导数）的反方向不断调整参数值，直到达到最小值点。 梯度下降的更新...

梯度下降算法(附MATLAB完整代码

02-14

梯度下降算法是一种在机器学习和优化问题中广泛使用的迭代方法，用于求解函数的局部最小值。在本文中，我们将深入探讨梯度下降的基本原理、实现步骤以及如何使用MATLAB进行编程。MATLAB作为一款强大的数值计算软件，...

对“基于Python和梯度下降算法的物理实验数据一元线性拟合方法”稿件的评审意见.pdf

06-29

2. 梯度下降算法：该算法是一种用于优化问题的迭代方法，通过计算损失函数（cost function）关于参数的梯度（即导数）来寻找最小值。梯度下降算法在机器学习模型训练中应用非常广泛，尤其在拟合实验数据、优化模型...

梯度下降算法(Gradient descent)

热门推荐

醉蕤的博客

06-15

2万+

人工智能基础算法 梯度下降算法Gradient descent

导数在梯度下降算法中的意义理解

非学无以广才，非志无以成学

04-10

819

梯度下降算法实际是在计算函数的极值问题，我们通过求函数的极值获取函数的局部最值在计算梯度下降的过程中，求函数的导数来通过逼近的方法去求局部最值而一般文章中介绍变量变化的时候是通过将变量自身减去导数值计算的，这点很难让人理解下面举例说明：函数f(x) =x^2+x-1 导函数的 f(x)' = 2x + 1 当x = 0 时候 f(x) = -1 f(x)' = 1 ...

Cost Function

BugMaker

10-21

483

1.Linear Cost Function: J(θ) = (1/2m) ∑( (m;i=1)(H_θ(xi) - yi)**2 ) 2.Logistic Regression Cost Function: Cost(H_θ(x), y) = { -log(H_θ(x)) if y = 1; -log(1 - H_θ(x)) if y = 0}

在导数为0时极值点仍然难求的情况下用梯度下降法逼近

lv17774848392的博客

12-15

256

https://zhuanlan.zhihu.com/p/36902908

梯度下降法是对谁求导？

qq_35078278的博客

04-14

1182

这里写自定义目录标题梯度下降法到底对谁求导？ 梯度下降法到底对谁求导？最近在用pytorch的时候，突然思考了一个问题，对于y=f(x)y=f(x)y=f(x)（例如y=Wx+by=\mathbf{W}x+\mathbf{b}y=Wx+b），是对谁求导？仔细想一下，好像我被初中函数f(x)=Wx+bf(x)=\mathbf{W}x+\mathbf{b}f(x)=Wx+b给误导了。一般我们都认为...

Logistic Regression 的 Cost function 的推倒过程

Sk8er的专栏

07-09

2642

Logistic Regression 不同于 Linear Regression，它可以是预测结果成为离散的值（比如正类、负类）。因此它可以作为 classification 的工具。如果听过Andrew Ng的Machine Learning课程的话，应该知道其实在进行优化求导过程中，Logisitc Regression 和 Linear Regression 的偏导数是一样样的。虽然他们的

梯度下降（Gradient Descent）小结

weixin_34221276的博客

10-17

3310

　　　　在求解机器学习算法的模型参数，即无约束优化问题时，梯度下降（Gradient Descent）是最常采用的方法之一，另一种常用的方法是最小二乘法。这里就对梯度下降法做一个完整的总结。 1. 梯度　　　　在微积分里面，对多元函数的参数求∂偏导数，把求得的各个参数的偏导数以向量的形式写出来，就是梯度。比如函数f(x,y), 分别对x,y求偏导数，求得的梯度向量就是(∂f/∂x, ∂f/∂y)...

梯度下降法的推导

qq_1443539042的博客

01-02

3081

梯度下降法是一个一阶最优化算法，通常也称为最陡下降法，要使用梯度下降法找到一个函数的局部极小值，必须向函数上当前点对应梯度的反方向的规定步长距离点进行迭代搜索。如果相反地向梯度正方向迭代进行搜索，则会接近函数的局部极大值点；这个过程则被称为梯度上升法。介绍梯度下降法之前首先先介绍一下梯度。梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向...

梯度下降matlab代码详解

06-20

梯度下降算法的基本思路是，找到目标函数的梯度（即方向导数）并将自变量沿着梯度方向移动一小步，直到达到目标函数的最小值。这个小步称为学习率。如果学习率太大，可能会导致算法无法收敛，如果学习率太小，可能会...