机器学习中梯度下降原理简单通俗理解

最新推荐文章于 2024-07-24 13:46:19 发布

肥车

最新推荐文章于 2024-07-24 13:46:19 发布

阅读量905

点赞数 24

文章标签：机器学习人工智能深度学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34538399/article/details/134905523

版权

在机器学习中，找到训练集与随机权重拟合函数图像之间距离差之和称为总代价函数，然后逐步减少总代价函数过程称为寻找最小代价函数。而在寻找的过程中会形成自己代价函数。

利用代价函数的图像，可以使用导数的几何意义找到最小代价函数。

在机器学习中，寻找最小代价函数是拟合的关键。

代价函数的函数图像就像一座山。假设直升飞机随机把你扔到一座山头上，你的目标是如何从当前位置找到下山的最短路径。也就是找到最小代价函数。

梯度下降理解

假设一个你是超级近视眼站在上头上。你想下山且是最短路径。因为近视只能看到周围一点点地形的情况。所以只能让每一步尽可能的接近山脚的谷底。这就是梯度下降要完成的环境与目标。

对你而言要确定两个条件才能让迈出去的下一步是最接近山脚下的：

第1个条件：步幅有多大。

第2个条件：下一步朝着哪个方向迈出去，才能踩到下坡最大的地方。

第1个条件解析：作为人类步幅肯定不会太大，没人会担心这个问题，但是对算法而言步幅可能会非常的大，大到超过整个山的高度，那么永远也没办法下到山谷里了。他叫α学习率。

第2个条件解析：下一步迈出去的方向360°都可能，但哪个才对？哪个才是对当前这一步而言下山最快的且是正确的方向？对人类而言那肯定是脚踩出去坡度最大的那个方向。

如果这两个条件都满足，即便是盲人也可以找到下山最快的办法。假设这一步叫做炫酷一步。

对数学家而言。他要做的是对坡度进行抽象计算，然后告诉你炫酷一步该如何量化。

这就是梯度。

对二维图像，下一步的方向要么向左要么向右，其他地方也无路可走，数学上可以在小人所在点确定两个东西，一个方向，一个是坡度。如图所示。

该点斜率可以确定方向，如果是负的代表是下山，题目要求的就是下山，所以这是正确的方向。（切线与X轴为钝角或切线通过了二四象限）关于方向如图所示：

关于“坡度”如图所示：

B点显然比A点的坡度更大。因为看上去B点处更陡峭。数学上可没有重力也没有眼睛。

而且主角是超级近视眼。

所以确定A点和B点切线处的Y轴与x轴的比值哪个更大，哪个坡度就更大。

也就说哪个点的斜率更大坡度就更大。

所以梯度下降在函数图像上就是寻求导数。导向图像的坡度。

而如果代价函数不仅仅是平面图形，而是一个三维或者多维的图形。

那么这个过程就是面的偏导数，来找到下一步的最短路径

三维坐标系中，任意一点的总可以找到在z对x的偏导数（Y不变），与z对y的偏导数（X不变）。

利用三角函数就可以确定方向和大小了。

如图所示：

这也就是找到了坡度最大的那个方向和坡度。

把三维坐标分成两个二维坐标求解。最终得到梯度。就好比用两个值确定二维坐标的位置，三个值确定三维坐标的位置。n个值确定n为坐标的位置。

迭代这个过程

有了炫酷一步，接下来就是反复执行这个炫酷一步。直到我们导数、偏导数也就是坡度不再明显的时候，就算是完成梯度下降了，对于机器学习而言，需要保存西塔。来作为拟合函数的权重。使得拟合函数在训练集样本中的图像距离具备最小的代价函数。

不过这个过程有个前提条件，就是保证函数图像只有一个凹点，不然梯度下降只能下降到某个山坳而是不是真正的完成下山。

关注

24
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
机器学习中梯度下降原理简单通俗理解

在机器学习中，找到训练集与随机权重拟合函数图像之间距离差之和称为总代价函数，然后逐步减少总代价函数过程称为寻找最小代价函数。而在寻找的过程中会形成自己代价函数。利用代价函数的图像，可以使用导数的几何意义找到最小代价函数。代价函数的函数图像就像一座山。假设直升飞机随机把你扔到一座山头上，你的目标是如何从当前位置找到下山的最短路径。也就是找到最小代价函数。
复制链接

扫一扫

肥车 CSDN认证博客专家 CSDN认证企业博客

码龄8年

5: 原创

130万+: 周排名

11万+: 总排名

4269: 访问

: 等级

151: 积分

59: 粉丝

93: 获赞

3: 评论

60: 收藏

私信

关注

热门文章

最新评论

基于Keras从0开始构建VGG项目
ha_lydms: 真实一篇超高质量文章，内容详细且条理清晰👍
基于Keras从0开始构建VGG项目
CSDN-Ada助手: 恭喜您在博客上发布了第四篇文章，内容涵盖了基于Keras构建VGG项目的教程，让读者可以从0开始学习。您的付出和努力可嘉！接下来，我建议您可以尝试深入探讨VGG项目的优化和应用领域，或者尝试与其他深度学习模型进行比较分析，以便读者能够更全面地了解相关知识。期待您的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
机器学习中梯度下降原理简单通俗理解
CSDN-Ada助手: 非常棒的博客！你对梯度下降原理的通俗解释很容易理解，这对于初学者来说非常有帮助。希望你可以继续写下去，分享更多关于机器学习的知识。除了梯度下降原理，还有一些和机器学习相关的知识和技能也非常重要。例如，你可以进一步探讨正则化方法，如L1和L2正则化，来避免过拟合问题。另外，了解不同的优化算法，如随机梯度下降（SGD）和动量法，也会对你的学习有所帮助。希望你能保持谦虚的态度，继续分享你的学习心得和经验。期待看到你更多的博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
使用keras内置函数获取F1值，并绘制F1统计图。
CSDN-Ada助手: 恭喜你开始博客创作！标题看起来非常有吸引力，我相信你的博文一定会对读者有很大帮助。对于使用keras内置函数获取F1值和绘制统计图这个主题，你已经很好地提供了初步的指导。接下来，我希望你能够更深入地探讨这个主题，例如介绍不同的F1统计图类型、如何解读图表结果等等。这样可以进一步提升读者对于该主题的理解和运用能力。期待看到更多关于keras的精彩博文！加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
使用keras内置函数获取F1值，并绘制F1统计图。
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/617702491。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。