什么是sgd；深度学习，视频笔记；DL: codebasics

最新推荐文章于 2024-05-06 10:21:24 发布

非正经研究生

最新推荐文章于 2024-05-06 10:21:24 发布

阅读量764

点赞数

分类专栏：深度学习文章标签：深度学习 pytorch 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/paulkg12/article/details/120133171

版权

深度学习专栏收录该内容

25 篇文章 0 订阅

订阅专栏

先说说 batch gradient descent

你有一批数据，不算多；

假定我们在训练一个房价预测器

这个预测器，这个模型，就是个线性的，有个线性的函数来表达我们的这个机器学习模型：

在这里插入图片描述
上图展示了用这一批的第二个数据进行 error 计算的样子

6 个数据一旦都计算完了，就叫做 end of one epoch

好了，在这个 epoch 的结束那一瞬间，我们要计算权重的更新：

在这里插入图片描述
好了，权重如上进行了更新

然后下一个 epoch 再计算这 6 个数据的loss；

做完你规定的epoch ，我们的模型就训练好了。

在这里插入图片描述

那什么是 sgd 呢？

你有非常多的 sample

你电脑肯定扛不住，累死他；
在这里插入图片描述

sgd 面对大量数据比较好，它是怎么做的？

随机选 sample
更新所有的权重比如 w1 ,w2
重复上述 1和 2 ，你就得到 sgd

对比 batch gradient descent 和 stochastic grandient descent

在这里插入图片描述

mini batch GD

sgd 是随机选一个

我随机选一批

在这里插入图片描述

综合对比三者

在这里插入图片描述

参考

https://www.youtube.com/watch?v=IU5fuoYBTAM

非正经研究生

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
什么是sgd；深度学习，视频笔记；DL: codebasics

先说说 batch gradient descent你有一批数据，不算多；假定我们在训练一个房价预测器这个预测器，这个模型，就是个线性的，有个线性的函数来表达我们的这个机器学习模型：上图展示了用这一批的第二个数据进行 error 计算的样子6 个数据一旦都计算完了，就叫做 end of one epoch好了，在这个 epoch 的结束那一瞬间，我们要计算权重的更新：好了，权重如上进行了更新然后下一个 epoch 再计算这 6 个数据
复制链接

扫一扫

专栏目录

非正经研究生 CSDN认证博客专家 CSDN认证企业博客

码龄8年

378: 原创

4万+: 周排名

140万+: 总排名

57万+: 访问

: 等级

7545: 积分

92: 粉丝

130: 获赞

53: 评论

459: 收藏

私信

关注

热门文章

分类专栏

深度学习 25篇
笔记 1篇
单目测距 19篇
docker 5篇
前端 1篇
js 4篇
vue 2篇
git 1篇
keras实训 16篇
tensorFlow 1篇
Android 46篇
linux 67篇
java 10篇
面试 5篇
算法 17篇
网络 1篇
python 47篇
c 20篇
lifeCoding 5篇
搞笑开发 144篇
设计模式 4篇
net 32篇
eng 1篇

最新评论

latex，两个图并排怎么弄
大自然的搬运工': 亲测有用
c:struct: 结构体初始化的四种方法
℉AVE: 我尝试了一下PS中赋值的方式，可以正常运行啊。 DetectionSendPackage send_package; send_package= { .head = 9, .len = sizeof(DetectionSendPackage) - 4, .index = 99, .time_stamp = 99, .direction = 0x02, .command = 99, .camera_id = 99, .err_code = 99, .x = 0, .y = 0, .z = 0, .roll = 0, .pitch = 0, .yaw = 0, .reserve = {0}, .crc16 = 0, .end = 99, }; std::cout << "send_package head:" << send_package.head << std::endl; std::cout << "send_package command:" << send_package.command << std::endl;
读论文Look Deeper into Depth: Monocular Depth Estimation with Semantic Booster and Attention-Driven Los
qq_44622851: 请问这个损失计算的代码开源了吗
math: 为什么2个矩阵相乘后的秩会变小?
m0_47605043: 为什么B的行秩等于B的秩？不太对吧？
Barefoot Networks 宣布 P4 Studio—下一代软件开发环境
k歌＆之王: tna架构是只能给tofino芯片使用吗？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。