梯度下降算法

梯度下降法用于最小化代价函数,通过不断调整参数寻找最优解。可能存在局部最优解问题,初始值的选择影响结果。多元梯度下降应用于多元线性回归,特征缩放能加速收敛。学习率的选择至关重要,过大可能导致不收敛或缓慢收敛,应尝试多种学习率观察曲线以确定合适值。
摘要由CSDN通过智能技术生成
  • 梯度下降法 Gradient descent
    在这里插入图片描述
    作用: 用来最小化函数,这里用来最小化代价函数。
    做法是:给定a,b最初值,一般起初都为0,然后不停的一点点(在图像上表示即是360度环绕四周,我下一步要怎么走才能最快下降到山底)的改变a,b来使得代价函数变小,直到找到代价函数的最小值或者局部最小值。从而也就确定了a,b的值
    梯度下降法的特点:最初点选择不同会得到一个不同的最优解。
    简化研究:假设只有一个参数如下图
    在这里插入图片描述
如果梯度下降已经到达了一个局部最优解,那么下一步梯度下降会怎么样?
答:参数将不再改变,如下图解释

在这里插入图片描述

在这里插入图片描述

  • 常存在局部最优解的问题,选择不同的初始值,最
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值