为了保证基于 PyTorch 的模型的可再现性,需要设定随机种子
但问题关键还是在于,如果知道随机性来自哪里,设置对应的随机种子即可
比如使用了 numpy.random,则应设置 numpy.random.seed(seed)
在 PyTorch 中主要有以下几种随机种子设置规则:
1、torch.manual_seed(seed)
设置用于生成随机数的种子,返回一个 torch.Generator 对象。
其内部还调用了将要提到的 torch.cuda.manual_seed_all(seed)
2、torch.cuda.manual_seed(seed)
设置当前GPU生成随机数的种子。
如果CUDA不可用,调用这个函数是安全的;在这种情况下,它会被默默地忽略。
如果使用了多个GPU,则应调用 torch.cuda.manual_seed_all(seed)。
3、torch.cuda.manual_seed_all(seed)
设置所有GPU上生成随机数的种子。
如果CUDA不可用,调用这个函数是安全的;在这种情况下,它会被默默地忽略。
以上函数 manual 的意义在于设为固定值,以保证可再现。
有些人提供了文件开头同时设置多项随机种子保证随机性,以求一劳永逸,可作参考。