[Neural Network] 梯度下降法

最新推荐文章于 2021-01-15 08:53:07 发布

Jack-lct

最新推荐文章于 2021-01-15 08:53:07 发布

阅读量257

点赞数 1

分类专栏：人工智能 # Neural Network 文章标签：机器学习神经网络

本文链接：https://blog.csdn.net/sinat_38161291/article/details/104661377

版权

Neural Network 同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

人工智能

0 篇文章 0 订阅

订阅专栏

1. What is Gradient Descent?

梯度下降法图例

2. Gradient Descent Algorithm

2.1 基本公式（以二元代价函数为例）

使用梯度下降法求使得代价函数最小化的参数，以二元代价函数为例，算法如下：
Gradient Descent Algorithm $其中，J(\theta_{0},\theta_{1})为代价函数； \alpha 表示学习率； \theta_{0},\theta_{1}为待定参数；$

2.2 注意

在更新参数的时候，要同时更新所有参数，即在更新参数的时候，代价函数中的所使用的参数都应该是未更新前的参数。
学习率太小，梯度会下降得很慢，但是学习率过大，有可能会越过最低点，难以收敛。
（重要）在逐渐靠近最低值的过程中，梯度逐渐趋近于0，下降的步长也会自动减小，趋近于0，因此不必减小学习率。
梯度下降法会受限于局部最小值。
Batch Gradient Descent：梯度下降的每一步都用到了所有训练集。

3. 线性回归的梯度下降

3.1 单个特征（单输入问题）

在这里插入图片描述

3.2 多个特征（多输入问题）

在这里插入图片描述

3.3 注意

（重要）Feature Scaling：多特征问题，为了更快收敛，要确保各个特征都在一个相邻的范围。
（重要）Mean Normalization：多特征问题，为了更快收敛，应使各个特征的平均值为0。
学习率可以尝试：... 0.001, 0.003, 0.01, 0.03, 0.1, 0.3, ...

4. Reference

[1] 吴恩达. MIT, 《机器学习》网络课程.

Jack-lct

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[Neural Network] 梯度下降法

目录What is Gradient Descent?Gradient Descent Algorithm基本公式（以二元代价函数为例）注意事项ReferenceWhat is Gradient Descent?Gradient Descent Algorithm基本公式（以二元代价函数为例）其中，α表示学习率;其中，\alpha 表示学习率;其中，α表示学习率;注意事项在更新参...
复制链接

扫一扫

专栏目录