梯度下降法优化

最新推荐文章于 2024-02-11 21:31:04 发布

无桨靠浪

最新推荐文章于 2024-02-11 21:31:04 发布

阅读量183

点赞数

文章标签：算法深度学习机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43910854/article/details/105623072

版权

梯度下降法优化

定义一个损失函数J(θ0, θ1)，用梯度下降法最小化J(θ0, θ1)的值
这是梯度下降法的算法定义θj := θj − α * (d / dθj) * J(θ0, θ1)
其中:=表示赋值，α是学习率代表梯度下降法计算时迈出多大的步子(d / dθj) * J(θ0, θ1)这是一个导数项d代表求导公式里面的那个符号。
在计算时需要同时更新θ0和θ1，算法表示为：

temp0 := θ0 − α * (d / dθ0) * J(θ0, θ1) 
temp1 := θ1 − α * (d / dθ1) * J(θ0, θ1) 
θ0 := temp0 
θ1 := temp1

循环往复直至θ0与θ1不再发生变化，于是并找出了局部最优解让损失达到最小
画图的方式理解（以单参数θ0的梯度下降为例）
在这里插入图片描述
箭头所指的地方并是(θ0,J(θ0))，切线则是那里的导数值(d / dθ0) * J(θ0)为正，根据公式θ0 = θ0 − α * (d / dθ0) * J(θ0)其中α 为正数，计算得到的θ0在减小，经过反复的训练最终会逼近图中最低点

同样，切线则是那里的导数值(d / dθ0) * J(θ0)为负，根据公式θ0 = θ0 − α * (d / dθ0) * J(θ0)其中α 为正数，计算得到的θ0在增大，经过反复的训练最终会逼近图中最低点
当在最低点时导数值(d / dθ0) * J(θ0)为0，θ0 = θ0 − α * 0，θ0则不会再变化
由此可见，公式中导数值的意义在于决定θ0向什么方向走，α决定走的步长，但梯度下降法只能达到局部的最优点就像图中的一样只能向最近的最低点移动。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄6年

11
原创

11
点赞

92
收藏

6
粉丝

关注

私信

热门文章

最新评论

使用yolo3自己训练的模型加上deep_sort实现多目标跟踪
CSDN-Ada助手: 非常感谢你分享使用yolo3自己训练的模型加上deep_sort实现多目标跟踪的经验，这篇博客对于想要深入学习目标跟踪技术的读者来说非常有价值。我建议你可以继续撰写关于目标跟踪的技术文章，比如介绍常用目标跟踪算法的优缺点、如何在实际项目中应用目标跟踪技术等。相信这样的文章会对读者有更大的帮助和启发。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
使用线性回归模型SGDRegressor进行预测
呵呵哒哒呀: 请问有数据集吗
分类算法比较
杨起风帆: 有可视化部分代码吗
使用yolo3自己训练的模型加上deep_sort实现多目标跟踪
小程是个什么鬼: 现在已经不研究这个了抱歉
使用yolo3自己训练的模型加上deep_sort实现多目标跟踪
booyah__: 你好您解决这个问题了吗我改成调用摄像头还是出现这个错误，换成视频路径也报错

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。