通俗易懂讲解梯度下降法!

本文以通俗易懂的方式介绍梯度下降法,包括其思想、算法、数学计算和分类。通过实例展示了如何使用Python实现梯度下降法,包括单变量和多变量情况,以及根据样本求解最佳参数。
摘要由CSDN通过智能技术生成

 Datawhale干货 

作者:知乎King James,伦敦国王大学

知乎 | https://zhuanlan.zhihu.com/p/335191534

前言:入门机器学习必须了解梯度下降法,虽然梯度下降法不直接在机器学习里使用,但是它的思维方式是后续学习其他算法的基础。网上已有的文章要么整一堆数学公式,要么就是简单草草了事。本篇文章用讲解+实战的形式,浅显易懂讲解,拥有高中数学知识即可看懂。

1. 引入

我们先从一个案例入手,下图是一组上海市静安区的房价信息

357825faf3e2dbaac46c29db78d1284c.png

别看了,数据我瞎编的,上海静安的房价不可能这么便宜

我们用Python在坐标系上面画出来如下图:

910f61169daa08c130c245f882b04dcc.png

我们现在想拟合一个线性函数来表示房屋面积和房价的关系。我们初中都学过的一元一次函数表达式为:y=kx+b(k≠0)。很明显不可能有一对组合(k,b)全部经过上图7个点,我们只能尽可能地找到一对组合,使得该线性函数离上图7个点的总距离最近。

d46ce6be5cc55bfb8ba33f192d9f54ec.png

如上图所示,实际值与预测值之间差异的均方差我们把它称为损失函数,也有叫做成本函数或者代价函数的,意义都一样。我们希望找到一个组合(k,b)可以使得损失函数的值最小。上述只有一个输入变量x,如果我们多加入几个输入变量,比如卧室的数量、离最近地铁站的距离。最终目标变量和损失函数我们用下述函数表达式来表达:

16367f5d16b2238b71f10ec21b14af8a.png

现在我们的任务就是求出一组θ,在已知【x,y】的前提下使得损失函数的值最小。那么如何计算出θ了,使用什么方法?

我们首先回到损失函数表达式本身,损失函数本身是一个y=x^2的形式,高中数学大家应该都学过这是一个开口向上的抛物线方程,大概长下图这样:

89854d00d018f2f16437f951fac7d736.png

我们如何找到这个函数的最低点?上图是一个二维图,我们很轻松就可以肉眼看出x=0时,y最小。如果维度更多,比如z = (x-10)^2 + (y-10)^2,则得到下图:

4ad005d5de8db42b6ccc1a2bdfb01c2e.png

我们如何定位出最小值,特别强调一点,这里的x是一个“大”参数的概念,x应该等于下述公式

1e1a4c0f20e4d170d3ae7b84f72f656f.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值