【深度学习】cudnn.benchmark 参数说明

comedate

于 2025-07-05 12:01:18 发布

阅读量247

点赞数 10

CC 4.0 BY-SA版权

分类专栏：大模型 Python实用源码深度学习文章标签：深度学习人工智能 benchmark 参数

本文链接：https://blog.csdn.net/comedate/article/details/149134947

109 篇文章

订阅专栏

43 篇文章

订阅专栏

2 篇文章

订阅专栏

`cudnn.benchmark` 参数详解

自动优化卷积算法
当设置为 True 时，PyTorch 会：
- 测试所有可用的 CuDNN 卷积算法
- 为当前输入尺寸选择最快的算法
- 缓存最优算法以供后续使用
输入尺寸固定时效果显著
对固定输入尺寸（如固定 batch size 和图像尺寸）的训练任务能明显加速

✅ 推荐开启的情况：

❌ 不建议开启的情况：

# 推荐在训练脚本开头设置
torch.backends.cudnn.benchmark = True  # 开启优化（输入尺寸固定时）
torch.backends.cudnn.benchmark = False # 关闭优化（输入尺寸变化时）

当前配置分析
“benchmark”: False, # 默认关闭
“deterministic”: True # 强制确定性
由于设定了 deterministic=True，benchmark 会自动失效
这种配置优先保证结果可复现性，牺牲了部分速度优化

固定输入尺寸 + 不要求严格确定性 → 开启 benchmark

可变输入尺寸 or 需要可复现性 → 关闭 benchmark

显存不足时 → 关闭 benchmark