梯度下降算法详解

最新推荐文章于 2024-06-19 22:53:09 发布

rocky_zheng

最新推荐文章于 2024-06-19 22:53:09 发布

阅读量1.5k

点赞数

分类专栏：机器学习文章标签：数据挖掘机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_16233463/article/details/37062975

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

在机器学习中梯度下降算法是一个很重要的方法。上次竟然有个面试题让描述梯度下降算法，曾用过的东西也说不清楚，真的很汗颜。

首先要说下梯度的概念。这要从微分说起，我们都清楚函数在平面上的曲线在某个点A对x微分，此处微分的意义为曲线在点A的变换率。多元函数的时候就有了方向导数的概念。因为这个时候函数的变化可以沿着不同的方向变化，例如在曲面上的任一点都可以有无数个可以变化的方向，方向倒数可理解为函数在某个方向上的变化率。梯度是一个向量，函数沿着梯度的方向是增长最快的方向，至于为什么先看下梯度的定义：

任一方向倒数都可以表示成梯度的模乘上该方向和梯度夹角的余弦。所以在夹角为0时方向导数最大，这就是为什么梯度方向是函数增长最快方向的原因。

在实际应用中，梯度下降和上市方法通常用来寻找最优解。上面只是理论的东西，下面是在求解回归参数上的例子。

例如回归方程为：

为了求参数a通常是让总体误差最小化

就是上面的函数值最小。这是关于参数a的函数。对上面的函数求梯度，然后在训练的时候确定一个步长，不断的用梯度去更新参数向量。具体细节参考稍后贴上的代码。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

rocky_zheng CSDN认证博客专家 CSDN认证企业博客

码龄10年

22: 原创

32万+: 周排名

95万+: 总排名

3万+: 访问

: 等级

483: 积分

11: 粉丝

2: 获赞

2: 评论

43: 收藏

私信

关注

热门文章

分类专栏

最新评论

java笔记——jsp实现简单论坛
weixin_47315865: 1
c++版id3决策树实现
lujian1989: 在Linux平台下发现以下几个问题：1.读取文件getline后有换行符，导致一些问题。 2.测试文件和训练文件用同样的读取函数，导致训练文件最后一列必须也要有target值。3.计算信息熵增益时，总体熵那个值可以放到Gain函数外面，不必每次循环都计算一遍
文本挖掘过程的特征提取
小排骨hahaha: 请问 fr=open("SupportFile\\wordNature.txt") 函数中wordnature.txt是什么文件？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。