基础算法-梯度下降的原理

本文介绍了梯度下降的基本原理,包括为何选择梯度下降以降低内存消耗,以及梯度下降的三种实现方式:批量梯度下降、随机梯度下降和小批量梯度下降。重点讲述了小批量梯度下降作为最常用的方法,以及学习率在优化过程中的作用和选取策略。
摘要由CSDN通过智能技术生成

数学原理

梯度下降

梯度下降概述

在这里插入图片描述
why是用梯度下降:
1、求解正规方程时,求矩阵的逆内存消耗比较大,特别是当数据量和Xn非常大时,内存消耗很大。利用梯度下降求解,虽然没有正规方程求解准确,但是降低了内存消耗,是一种折中的办法。梯度下降一般不会达到最小值,一般会在最小值附近徘徊。
2、a.一个矩阵是方阵时才可逆。X不一定可逆,虽然numpy库会给出一个伪逆。b.A^-1 =A*/|A|,|A|等于0时就不存在逆

在这里插入图片描述

梯度下降细节

在这里插入图片描述

梯度下降只要在梯度上加个负号

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值