梯度下降

最新推荐文章于 2022-09-14 21:29:12 发布

Yun_Self

最新推荐文章于 2022-09-14 21:29:12 发布

阅读量215

点赞数

分类专栏：机器学习文章标签：梯度下降

本文链接：https://blog.csdn.net/u014626513/article/details/101700374

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

梯度下降

引入：当我们得到了一个目标函数后，如何进行求解？
直接求解？（并不一定可解，线性回归可以当做一个特例）
常规套路：机器学习的套路就是我交给机器一堆数据，然后告诉它什么样的学习方式是对的（目标函数），然后让它朝着这个方向去做
如何优化：一口吃不成胖子，我们要静悄悄的一步步的完成迭代（每次优化一点点，积累起来就是个大成绩）

目标函数： $J(\theta_{0},\theta_{1})=\frac{1}{2m}\sum_{i=1}^{m}(h_{\theta}(x^{i})-y^{(i)})^{2}$
在这里插入图片描述
寻找山谷的最低点，也就是我们的目标函数终点（什么样的参数能使目标函数达到极值点）
下山分几步走？（更新参数）
（1）找到当前最合适的方向
（2）走那么一小步，走快了该“跌倒”了
（3）按照方向与步伐去更新我们的参数

梯度下降，目标函数： $J(\theta_{0},\theta_{1})=\frac{1}{2m}\sum_{i=1}^{m}(h_{\theta}(x^{i})-y^{(i)})^{2}$
一般有三种梯度下降的方式：
批量梯度下降： $\frac{\partial J(\theta)}{\partial \theta_{j}}=-\frac{1}{m}\sum_{i=1}^{m}(y^{i}-h_{0}(x^{i}))x_{j}^{i}$
(容易得到最优解，但是由于每次考虑所有的样本，速度很慢)
随机梯度下降： $\theta_{j}^{'}=\theta_{j}+(y^{i}-h_{\theta}(x^{i}))x_{j}^{i}$
(每次找一个样本，迭代速度快，但是不一定每一次都朝着收敛的方向)
小批量梯度下降法： $\theta_{j}:=\theta_{j}-\alpha \frac{1}{10}\sum_{k=i}^{i+9}(h_{\theta}(x^{(k)})-y^{(k)})x_{j}^{(k)}$
（每次更新选择一小部分数据进行计算，实用！！！）

梯度下降学习率

学习率（步长）：对结果会产生巨大的影响，一般取值小点
如何选择：从小的时候选择，不行再小
批处理数量：32,64,128一般都可以，很多时候还得考虑内存和效率
在这里插入图片描述

Yun_Self

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
梯度下降

梯度下降引入：当我们得到了一个目标函数后，如何进行求解？直接求解？（并不一定可解，线性回归可以当做一个特例）常规套路：机器学习的套路就是我交给机器一堆数据，然后告诉它什么样的学习方式是对的（目标函数），然后让它朝着这个方向去做如何优化：一口吃不成胖子，我们要静悄悄的一步步的完成迭代（每次优化一点点，积累起来就是个大成绩）目标函数：J(θ0,θ1)=12m∑i=1m(hθ(xi)−y(i)...
复制链接

扫一扫

专栏目录