pytorch如何确保每次实验可重复性(每次训练测试结果相同)(模型每次结果也不一样的问题解决方法)（固定随机种子等操作）

路边风景也很美！

已于 2024-03-19 19:18:35 修改

阅读量1.7k

点赞数 12

分类专栏： python 文章标签： pytorch 深度学习人工智能

于 2024-03-18 13:33:38 首次发布

本文链接：https://blog.csdn.net/huiyayaya/article/details/136806379

版权

python 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

影响可复现的因素主要有这几个：
1、随机种子
2、训练使用不确定的算法
CUDA卷积优化——CUDA convolution benchmarking
Pytorch使用不确定算法——Avoiding nondeterministic algorithms
3、数据加载DataLoader
4、自己代码是否使用随机排列数据集

1跟2，直接复制下面的代码，全网最全（自认为）

# 固定随机种子等操作
            seed_n = 42
            print('seed is ' + str(seed_n))
            g = torch.Generator()
            g.manual_seed(seed_n)
            random.seed(seed_n)
            np.random.seed(seed_n)
            torch.manual_seed(seed_n)
            torch.cuda.manual_seed(seed_n)
            torch.cuda.manual_seed_all(seed_n)
            torch.backends.cudnn.deterministic=True
            torch.backends.cudnn.benchmark = False
            torch.backends.cudnn.enabled = False
            torch.use_deterministic_algorithms(True)
            os.environ['CUBLAS_WORKSPACE_CONFIG'] = ':16:8'
            os.environ['PYTHONHASHSEED'] = str(seed_n)  # 为了禁止hash随机化，使得实验可复现。

(如果觉得训练太慢，用这个)

# 固定随机种子等操作
            seed_n = 42
            print('seed is ' + str(seed_n))
            g = torch.Generator()
            g.manual_seed(seed_n)
            random.seed(seed_n)
            np.random.seed(seed_n)
            torch.manual_seed(seed_n)
            torch.cuda.manual_seed(seed_n)
            torch.cuda.manual_seed_all(seed_n)
            # torch.backends.cudnn.deterministic=True
            # torch.backends.cudnn.benchmark = False
            # torch.backends.cudnn.enabled = False
            # torch.use_deterministic_algorithms(True)
            # os.environ['CUBLAS_WORKSPACE_CONFIG'] = ':16:8'
            os.environ['PYTHONHASHSEED'] = str(seed_n)  # 为了禁止hash随机化，使得实验可复现。

3点注意检查自己代码是否使用DataLoader
将shuffle=False

dataloader = torch.utils.data.DataLoader(dataset=dataset, batch_size=batch_size, shuffle=False)

4、自己代码是否使用随机排列数据集

类似于下面这种注释掉

# aug_shuffle = np.random.permutation(len(aug_data))
# aug_data = aug_data[aug_shuffle, :, :]
 # aug_label = aug_label[aug_shuffle]

最后附上二次运行的结果！
在这里插入图片描述

路边风景也很美！

关注

12
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
pytorch如何确保每次实验可重复性(每次训练测试结果相同)(模型每次结果也不一样的问题解决方法)（固定随机种子等操作）

Pytorch使用不确定算法——Avoiding nondeterministic algorithms。CUDA卷积优化——CUDA convolution benchmarking。3点注意检查自己代码是否使用DataLoader。1跟2，直接复制下面的代码，全网最全（自认为）4、自己代码是否使用随机排列数据集。4、自己代码是否使用随机排列数据集。3、数据加载DataLoader。将shuffle=False。2、训练使用不确定的算法。最后附上二次运行的结果！类似于下面这种注释掉。
复制链接

扫一扫

专栏目录