ML4⃣️：梯度下降

skylar0

已于 2023-12-19 17:14:07 修改

阅读量42

点赞数

文章标签：机器学习人工智能

于 2023-12-07 18:47:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/skylar0/article/details/134853432

版权

文章目录

1. 梯度下降Gradient Descent（找到minimum J（w）的好方法）
2. 梯度下降的实现
- 2.1 梯度下降的算法
3. 理解梯度下降（derivative的重要性）
4. 学习率learning rate
5. 线性回归的梯度下降
6. 实例

1. 梯度下降Gradient Descent（找到minimum J（w）的好方法）

用来找到w，b，在J(w)最小的时候。
代价函数J(w,b)，我们想要最小化代价函数。
outline：
1. start with some w，b。通常set w = 0，b = 0
2. 不断变化w，b的值去降低J(w,b)。
3. until 我们找到or 靠近minimum（注意：J(w,b)函数不一定是u型/碗状的，minimum可能不止一个。）

2. 梯度下降的实现

2.1 梯度下降的算法

公式：

请添加图片描述

α: learning rate, 范围[0,1]。如果α很大，则梯度下降很快。

同时更新w，b的值。

3. 理解梯度下降（derivative的重要性）

假设只有一个参数w，例1显示斜率 > 0，derivative > 0，w会左移，更接近minimize w。
假设只有一个参数w，例2显示斜率 < 0，derivative < 0，w会右移，更接近minimize w。

4. 学习率learning rate

α太小，gradient descent会很慢。
α太大，gradient descent有可能oveershoot，错过minimum，导致J(w)反而变大。—> diverge离散

请添加图片描述

如果w已经在J(w)的local minimum了，derivative = 0，则w会不变。
【当w不变时，则到达了J(w)的local minimum】
即使α不变，当接近local minimum的时候，会自动采取更小的步骤接近他。因为derivative（斜率）在变小，所以steps会变小。

5. 线性回归的梯度下降

请添加图片描述

请添加图片描述

对于linear regression来说(它的特性)，找到的minimum一定是globle minimum。

6. 实例

从w=-0.1，b=900开始，f(x)=-0.1x+900
实现梯度下降的过程：

请添加图片描述

“Batch” gradient descent：批量梯度下降

“Batch”gradient descent每一步都会使用所有的training examples。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ML4⃣️：梯度下降

1. 梯度下降Gradient Descent用来找到w，b，在J(w)最小的时候。代价函数J(w,b)，我们想要最小化代价函数。outline：start with some w，b。通常set w = 0，b = 0不断变化w，b的值去降低J(w,b)。until 我们找到or 靠近minimum（注意：J(w,b)函数不一定是u型/碗状的，minimum可能不止一个。）2. 梯度下降的实现2.1 梯度下降的算法公式：α: learning rate, 范围[0,
复制链接

扫一扫

skylar0 CSDN认证博客专家 CSDN认证企业博客

码龄1年

68: 原创

31万+: 周排名

5万+: 总排名

2万+: 访问

: 等级

1048: 积分

299: 粉丝

357: 获赞

12: 评论

310: 收藏

私信

关注

热门文章

最新评论

ML：2-2-1 Tensorflow
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Java自学笔记：浮点数float
CSDN-Ada助手: 恭喜您写了第16篇博客，标题为“Java自学笔记：浮点数float”！在这篇博客中，您对浮点数float的内容进行了讲解，这对初学者来说非常有帮助。您的努力和持续创作是令人钦佩的。接下来，我建议您可以考虑深入研究与浮点数相关的更高级的主题，例如double类型或者浮点数的精度问题，这些内容会对读者有更全面的帮助。谦虚地说，我期待着您未来更多的精彩博客！
java自学笔记：java API文档
CSDN-Ada助手: 恭喜您写了第17篇博客！标题为“java自学笔记：java API文档”。您的坚持和努力令人钦佩。通过分享自己的学习笔记，您不仅对Java API文档有了更深入的理解，也帮助了其他自学者。在下一步的创作中，我建议您可以尝试深入研究Java中的某一个具体API，结合实际应用场景进行讲解，这样能够更加生动地展示您对Java的理解。期待您的下一篇博客！
Markdown学习
CSDN-Ada助手: 恭喜你写了第18篇博客！标题看起来非常有趣，我很期待阅读你关于Markdown学习的分享。你的坚持写作让我非常佩服，这种持续创作的精神非常难能可贵。对于下一步的创作建议，或许你可以考虑分享一些Markdown的高级技巧或是如何将Markdown与其他工具或平台结合运用，这样可以为读者提供更深入的学习体验。希望你能继续保持写作的热情，期待你未来更多的精彩博客！
java自学笔记：变量
CSDN-Ada助手: 恭喜您写下了第11篇博客！标题为“java自学笔记：变量”真是挺吸引人的。能够坚持写作不易，您的努力可嘉。对于刚开始自学的人来说，理解和掌握变量是非常关键的一步，您的博客内容无疑能够给他们带来很大帮助。希望您能够继续保持创作的热情，分享更多有关Java的知识。下一步的创作建议是，您可以深入讲解变量的不同类型和使用场景，或是结合实例演示变量的作用，这样读者能够更加直观地理解和运用。期待您的下一篇博客！

大家在看

VUE 使用element el-tooltip封装多行溢出时显示不溢出不显示tooltip（组件版本绝对好用适用单行多行 bug修复） 147

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。