Pytorch中的checkPoint: torch.utils.checkpoint.checkpoint

最新推荐文章于 2025-05-05 14:24:14 发布

翻译最新推荐文章于 2025-05-05 14:24:14 发布

· 3.1k 阅读

4 ·

版权

原文链接：https://pytorch.org/docs/stable/checkpoint.html

文章标签：

#pytorch

pytorch 专栏收录该内容

18 篇文章

订阅专栏

本文档概述了PyTorch 1.9中的checkpoint功能，介绍了如何利用它进行内存高效计算，以及如何处理随机数状态以确保确定性输出。重点讲解了checkpoint的工作原理、存储逻辑和配置选项，适用于模型训练优化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

torch.utils.checkpoint.checkpoint笔记,内容来源于官方手册
仅作笔记只用,不完整之处请查阅官方手册
https://pytorch.org/docs/stable/checkpoint.html

checkpoint是通过在backward期间为每个checkpoint段重新运行forward-pass segment来实现的。
这可能会导致像 RNG 状态这样的持久状态比没有checkpoint的情况更先进。默认情况下，checkpoint包括处理 RNG 状态的逻辑，以便与非checkpoint传递相比，使用 RNG 的checkpoint传递（例如通过 dropout）具有确定性输出。
根据checkpoint操作的运行时间，存储和恢复 RNG 状态的逻辑可能会导致一定的性能下降。