批梯度下降法与随机梯度下降法

最新推荐文章于 2021-05-18 15:19:57 发布

Zoey29

最新推荐文章于 2021-05-18 15:19:57 发布

阅读量393

点赞数

分类专栏：机器学习文章标签： GD SGD 梯度下降法随机梯度下降法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zealfory/article/details/79092664

版权

机器学习专栏收录该内容

20 篇文章 0 订阅

订阅专栏

选定线性回归模型后，确定参数 θ后就可以将模型用来预测。目标函数 J(θ) 最小时 θ 才能确定。因此问题归结为求极小值问题，使用梯度下降法。批梯度下降法最大的问题是求得的有可能是局部极小值，这与初始点选取有关。
梯度下降法流程：
1）首先对 θ 赋值，可以是随机的，也可以让 θ 是一个全零的向量。
2）改变 θ 的值，使得 J(θ) 按梯度下降的方向进行减少。
梯度方向由 J(θ) 对 θ 的偏导数确定，由于求的是极小值，因此梯度方向是偏导数的反方向。

迭代更新的方式：

批梯度下降BGD
batch gradient descent, 对全部的训练数据求得误差后再对 θ 进行更新；
随机梯度下降（增量梯度下降） SGD
stochastic gradient descent (incremental gradient descent),每扫描一次都对θ 进行更新。可以在一定程度上避免陷入局部最优。
mini-batch gradient descent MBGD
每次扫描一部分训练数据对θ进行更新

第一种方法能够不断收敛，第二种方法可能结果不断在收敛处徘徊，第三种方法是两者的折中。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
批梯度下降法与随机梯度下降法

选定线性回归模型后，确定参数 θ后就可以将模型用来预测。目标函数 J(θ) 最小时 θ 才能确定。因此问题归结为求极小值问题，使用梯度下降法。梯度下降法最大的问题是求得的有可能是全局极小值，这与初始点选取有关。梯度下降法流程： 1）首先对 θ 赋值，可以是随机的，也可以让 θ 是一个全零的向量。 2）改变 θ 的值，使得 J(θ) 按梯度下降的方向进行减少。梯度方向由 J(θ) 对
复制链接

扫一扫

专栏目录

Zoey29 CSDN认证博客专家 CSDN认证企业博客

码龄10年

107: 原创

13万+: 周排名

73万+: 总排名

37万+: 访问

: 等级

4362: 积分

50: 粉丝

169: 获赞

27: 评论

389: 收藏

私信

关注

热门文章

分类专栏

最新评论

原码, 反码, 补码详解
做而论道_CS: 补码，是一个 “代替负数” 的正数。补码，并不是 “原码取反加一”。补码，它是来自于【算法】。你看吧：　　25 － 1 = 24 　　25 + 99 = (一百) 24 你如果舍弃进位：　+99 就能代替－1。　减法，也就用加法代替了。但是，如果保留进位，+99，就还是 +99。只要舍弃了进位，补码，就诞生了。补码的理论依据，就是这么简单。
原码, 反码, 补码详解
做而论道_CS: 实际上，任意负数（－X）的补码，都是：0 － X。你用二进制简单算一下，立刻就能得到结果。（－128 的 8 位补码，也就是这样求出来的。）同理，任意正数（＋X）的补码，也都是：0 ＋ X。这还用算？ 0 ＋ X，不就是 X 吗？即，正数的补码，就是 X 本身！求补码，就是这么简单。符号位原码反码取反加一符号位不变模... 这些垃圾，并无任何用处。计算机专家说这些，不过是 “拿个鞋拔子当如意” 而已。
原码, 反码, 补码详解
做而论道_CS: 学习计算机，首先要记住： 1. 计算机使用二进制。 2. 计算机的字长是固定的。　八位机，每次计算，就是 8 位数。 3. 计算机只有加法器。　负数以及减法，都必须用加法来实现。－－－－－－－－－－－－－－－－－－－那么，14－14 = 0，计算机将怎么计算呢？八位机的算法是：　0000 1110 + xxxx xxxx = 0000 0000。这里的 xx...x，就是【－14 的补码】。这个 xx...x，究竟是什么？你自己，肯定可以推导出来。先移项：xxxx xxxx = 0000 0000－0000 1110。可算出：xxxx xxxx = (借位 1) 1111 0010。取八位：xxxx xxxx = 1111 0010。此时，就求出了 [－14]补码 = 1111 0010。简单不简单？意外不意外？－－－－－－－－－－－－－－－－－－－你用 “取反加一”，也能求出这个结果。但是，用 “取反加一”，你就不能理解：　减法，怎么就变成加法了？计算机专家和计算机老师，都是小学没毕业就迷上了计算机。（即使毕业了，也没有达到相应的水平。）很简单的事，也弄不明白，就胡乱的猜想，编造理由。显然，他们就是一帮：　【知其然不知其所以然】的货色。
原码, 反码, 补码详解
做而论道_CS: 补码，它就是补码。补码，与原码反码，都没有任何关系。如果码长是 8 位，各码的表示范围是：原码：－127 ~ +127；反码：－127 ~ +127；补码：－128 ~ +127。看到了吗？－128 只有补码，并没有原码和反码。没有原码，拿什么取反？没有反码，拿什么加一？用 “符号位原码反码取反加一” 这一套，　来定义补码，就是一个谎言。
java受检异常与运行时异常
！巴普洛夫的狗: 写的很棒！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。