机器学习之梯度下降算法

Aliert

已于 2022-06-05 15:58:35 修改

阅读量1.8k

点赞数 1

分类专栏：机器学习文章标签：算法机器学习人工智能

于 2022-06-05 11:21:52 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38375203/article/details/125129537

版权

前言

因为是CV出身的，转了推荐算法，前面也写了很多关于推荐算法的东西，但是最近写的有点疲了，思前想后决定先放一下推荐算法的基础模型。这几天先写一下机器学习和深度学习的东西，各个领域融会贯通一下。梯度下降算法是求解无约束多元函数极值最常用的数值方法，很多机器学习常用算法和神经网络都是以它作为算法框架进行优化参数。所以这个算法非常重要。梯度下降也是一种优化算法，通过迭代的方式寻找使模型目标函数达到最小值时的最优参数，当目标函数为凸函数的时候，梯度下降的解是全局最优解，但在一般情况下，梯度下降无法保证全局最优。

介绍梯度下降之前按先讲一下为什么大家公认的负梯度方向是f ( x ) 减小最快的方向，这背后又又又又涉及到了泰勒的知识，所以首先就来看看这个问题，简单推导一下为啥是负梯度方向。

一、Why负梯度方向下降最快

众所周知，沿梯度方向的方向导数可以来描述函数的最大变化率，即梯度方向是函数变化率最大的方向，这个也是梯度的定义。这里不太明白的小伙伴可以先去看一下这方面的数学知识，在这里我就不搬运教材图片了。这里我们假设函数f ( θ ) 是一个多元函数，那么我们由泰勒把这个函数进行展开至一阶导数的位置，就会得到：

我们知道这里的f ( θ ) , f ( $\theta_0$ )是个值，也就是标量，而加号后面那两个是向量，但是点积之后就成了标量。我们可以令θ − $\theta_0$ =ηv，即一个向量可以分解为一个长度和一个方向的乘积，这里的η 表示步长，这里的v 表示方向，那么就可以对上面式子进行化简：

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
机器学习之梯度下降算法

因为是CV出身的，转了推荐算法，前面也写了很多关于推荐算法的东西，但是最近写的有点疲了，思前想后决定先放一下推荐算法的基础模型。这几天先写一下机器学习和深度学习的东西，各个领域融会贯通一下。梯度下降算法是求解无约束多元函数极值最常用的数值方法，很多机器学习常用算法和神经网络都是以它作为算法框架进行优化参数。所以这个算法非常重要。梯度下降也是一种优化算法，通过迭代的方式寻找使模型目标函数达到最小值时的最优参数，当目标函数为凸函数的时候，梯度下降的解是全局最优解，但在一般情况下，梯度下降无法保证全局最优
复制链接

扫一扫

专栏目录

Aliert CSDN认证博客专家 CSDN认证企业博客

码龄7年

36: 原创

39万+: 周排名

35万+: 总排名

16万+: 访问

: 等级

566: 积分

102: 粉丝

175: 获赞

27: 评论

848: 收藏

私信

关注

热门文章

分类专栏

最新评论

目标检测指标mAP详解
露露晶的吉祥农场: 请问二、里面的图是换了吗？
one-hot和multi-hot编码
爱喝咖啡的Tomcat: VIP文章真没必要吧。。。
【目标检测】YOLOV3详解
祝我早日退休_: 除非特征图变成1*1了否则映射回原图都只会是部分区域。
推荐算法之Wide&Deep模型
aware2016: 您好，请问文章最开始的每种算法模型之间的关系演进图是哪本书上的？
机器学习之L1正则化和L2正则化（附源码解析）
一定向着光的方向: 博主，关于L2正则化的完整代码可以发一下吗

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。