DiAD代码use_checkpoint

最新推荐文章于 2024-09-06 16:24:02 发布

mm_exploration

最新推荐文章于 2024-09-06 16:24:02 发布

阅读量334

点赞数 4

分类专栏： MyDiffusion 文章标签： pytorch python diffusion attention

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37737957/article/details/140815238

版权

MyDiffusion 专栏收录该内容

26 篇文章 0 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

目录

1、梯度检查点理解
2、 torch.utils.checkpoint.checkpoint函数

1、梯度检查点理解

梯度检查点（Gradient Checkpointing）是一种深度学习优化技术，它的目的是减少在神经网络训练过程中的内存占用。在训练深度学习模型时，我们需要存储每一层的激活值（即网络层的输出），这样在反向传播时才能计算梯度。但是，如果网络层数非常多，这些激活值会占用大量的内存。

梯度检查点技术通过只在前向传播时保存部分激活值的信息，而在反向传播时重新计算其他激活值，从而减少了内存的使用。具体来说，它在前向传播时使用 torch.no_grad() 来告诉PyTorch不需要计算梯度，因为这些激活值会在反向传播时重新计算。

假设我有一个深度神经网络，网络有20层，每层都需要保存激活值以便反向传播时计算梯度。如果没有使用梯度检查点，你需要在内存中保存所有20层的激活值。如果使用梯度检查点，你可以在前向传播时只保存第1层和第20层的激活值，而在反向传播时重新计算第2层到第19层的激活值。这样，你就大大减少了需要保存的激活值数量，从而节省了内存。
启用梯度检查点可以减少内存占用，但可能增加计算成本。

2、 torch.utils.checkpoint.checkpoint函数

torch.utils.ch

了解本专栏

超级会员免费看

关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
DiAD代码use_checkpoint

1、梯度检查点理解2、 torch.utils.checkpoint.checkpoint函数
复制链接

扫一扫

专栏目录

mm_exploration CSDN认证博客专家 CSDN认证企业博客

码龄8年

123: 原创

1万+: 周排名

1万+: 总排名

14万+: 访问

: 等级

1744: 积分

406: 粉丝

447: 获赞

15: 评论

698: 收藏

私信

关注

热门文章

分类专栏

最新评论

Diffusion Model相关论文解析（十二)GLAD
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
扩散模型中的UNET
yanzhiyi: 这篇文章很有启发性，不过我很好奇你提到的位置编码的查找过程，能不能具体讲讲，或者提供一些参考的文章
（七）mmdetection源码解读：训练数据加载流程之pipeline（一）
qq_42437537: 能不能请教下，test_pipeline里怎么使用pad，我直接用会导致准确度大幅下降，是不是因为把标注图也pad了
（二十五）mmdetection源码解读：config配置文件之datasets
qq_42437537: 想请教下，怎么看transforms里都有什么操作呀
深入了解python函数装饰器在mmdetection中的使用（一）
lyccccccccp: [code=python] Traceback (most recent call last): File "train.py", line 242, in <module> main() File "train.py", line 214, in main datasets = [build_dataset(cfg.data.train)] File "E:\SegNeXt-main\SegNeXt-main\mmseg\datasets\builder.py", line 85, in build_dataset datasets = build_from_cfg(cfg, DATASETS, default_args) File "D:\Anaconda\envs\faster_rcnn\lib\site-packages\mmcv\utils\registry.py", line 72, in build_from_cfg raise type(e)(f'{obj_cls.__name__}: {e}') TypeError: MyDataset: __init__() got an unexpected keyword argument 'dataset' 请问遇到这种情况该怎么办？ [/code]

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。