深度学习笔记（28、29）

最新推荐文章于 2024-09-13 19:03:07 发布

不拿奖学金不改名

最新推荐文章于 2024-09-13 19:03:07 发布

阅读量169

点赞数

分类专栏：机器学习笔记文章标签：机器学习 python pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44217534/article/details/121556190

版权

梯度下降动量优化小批量随机梯度下降权重更新数据预处理

关键词由CSDN通过智能技术生成

机器学习笔记专栏收录该内容

9 篇文章 0 订阅

订阅专栏

课程28

之前进行了前向反向的传播，但是还没有实现坐标点的移动，这节就是讲这个

这里的步长设置的大是因为演示，为了能看出来变化

这个得到的不是tensor本身，还包括其他的一些说明

这样可以取出来，只剩下tensor

这样就定义了梯度dw和w

运行之后w就进行了迭代

每进行一次迭代之后，权重就会发生变化，那么正向传播的w数值就会发生变化，所以需要重新进行一次正向传播，如此迭代来更新w的值

动量Momentum

上面的式子就是第二步的真实方向，下面的就是让w按照这个方向进行移动

代码实现：

定义v的初始值，大小与dw一致

运行以上两段代码就可以进行迭代了

可以用模块进行实现

SGD：随机梯度下降

模型构建的一个基本流程：

梯度下降的一个基本流程：

ps：在计算交叉熵损失函数的时候，内置的损失函数的函数会自带softmax，所以在构建网络的时候不需要在写softmax层（大概是这样，不一定准确）

完整的梯度下降的一个流程

课程29

batch_size和epochs

for循环在python里比较慢，所以要小批量随机梯度下降节省时间

使用epochs进行迭代

有关数据

我们获取到的数据并不是pytorch可以处理的数据，需要进行处理成pytorch可以处理的数据

将数据的标签和特征整合到一起去，第一个维度要一样才能整合到一起去

数据集划分成小批量：Dataloader

这里面的i[0]对应的就是特征张量，i[1]对应的应该就是标签吧

查看样本

查看第一个样本的特征张量，后面改成1就是查看第一个样本的标签了

不拿奖学金不改名

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。