Pytorch深度学习遇到的坑

最新推荐文章于 2021-10-13 22:49:08 发布

`AllureLove

最新推荐文章于 2021-10-13 22:49:08 发布

阅读量431

点赞数 1

分类专栏：深度学习通用专栏文章标签： python 深度学习网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36488653/article/details/112169919

版权

深度学习通用专栏专栏收录该内容

4 篇文章 2 订阅

订阅专栏

pytorch深度学习遇到的坑

记录学习过程中遇到的一些问题以及解决方案。

Q1：pytorch自定义损失函数类无法调用

在继承了nn.Module的情况下，并且函数内数学运算均为torch内置函数（运算过程不能够破坏pytorch计算图，否则梯度无法正确反向传播），依旧无法调用：

初始化有问题 可以尝试在类构造函数末尾加入return；
调用方式错误 在调用构造类对象时，不能直接进行调用，要先构造类对象，然后使用类对象来进行损失的计算；

Q2：Out of memory显存不够

显存的运算和batch size以及图像大小息息相关，显存不够的解决办法：
1.调低batch size
2.将图像进行resize尺寸变小

Q3：训练损失几乎无变化

原始数据集数据不好 原始数据集标注对应关系有问题，网络将无法学习对应关系；
网络模型过于简单 对于复杂关系的学习，模型过于简单参数过少，无法匹配对应关系，需要换一个更复杂的模型；
学习率设置不合理 过大或者过小都会影响网络的学习效果，因此需要调整学习率；
数据量很大 若数据集数据量很大，则需要等待一定的时间损失才会下降；
Batch Size设置不合理 batch size设置过小，计算损失的数据量不够充分；
数据集量过小 数据过少，容易出现过拟合。
数据从卷积网络中输出未归一化 需要在网络后加入batch normalization

Q4：训练集损失小于验证集

1.正则化过度…To Do

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
3
评论
Pytorch深度学习遇到的坑

pytorch深度学习遇到的坑记录学习过程中遇到的一些问题以及解决方案。Q1：pytorch自定义损失函数类无法调用在继承了nn.Module的情况下，并且函数内数学运算均为torch内置函数（运算过程不能够破坏pytorch计算图，否则梯度无法正确反向传播），依旧无法调用：初始化有问题可以尝试在类构造函数末尾加入return；调用方式错误在调用构造类对象时，不能直接进行调用，要先构造类对象，然后使用类对象来进行损失的计算；Q2：Out of memory显存不够显存的运算和batch
复制链接

扫一扫

专栏目录

`AllureLove CSDN认证博客专家 CSDN认证企业博客

码龄8年

111: 原创

6万+: 周排名

1万+: 总排名

21万+: 访问

: 等级

1567: 积分

221: 粉丝

358: 获赞

62: 评论

1100: 收藏

私信

关注

热门文章

分类专栏

最新评论

【论文阅读】Scaling Laws for Neural Language Models（2020）- 大模型预训练参数量、数据集大小、计算资源之间的关系验证
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
git报错invalid object xxx和unable to read tree xxxxxx
E. M. T: 全赖我360清理大文件的时候把git的本地缓存文件也不认识的删掉了,哈哈哈哈
【实战教程】linux系统下载huggingface大模型教程
普通网友: 这篇文章是优质之作，内容充实，结构明晰，语言流畅且通俗易懂，适合广大读者阅读。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【论文阅读】基于深度学习的时序异常检测——Anomaly Transformer
`AllureLove: 数据集类就是用eumerate函数迭代获取样本数据和标签，默认会调用这个内置函数
【论文阅读】基于深度学习的时序异常检测——Anomaly Transformer
qq_48948941: 博主 PSMSegLoader函数读取数据集在训练模式 __getitem__ 怎么返回测试数据集的标签搞不懂您可以解答一下啊吗谢谢您

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。