Pytorch 可复现性设置随机数种子

Pytorch 可复现性设置随机数种子

为了实现pytorch训练神经网络可复现性需要进行以下操作:

设置随机数种子

def setup_seed(seed):
    torch.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)
    np.random.seed(seed)
    random.seed(seed)
    os.environ['PYTHONHASHSEED'] = str(seed)
    # os.environ['CUDA_LAUNCH_BLOCKING'] = str(1)
    os.environ['CUBLAS_WORKSPACE_CONFIG'] = ':4096:8'
    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    torch.backends.cudnn.enabled = False
    torch.backends.cudnn.benchmark = False
    torch.backends.cudnn.deterministic = True
    torch.use_deterministic_algorithms(True)

其中torch.use_deterministic_algorithms(True)会强制pytorch的操作是可复现性的,如果存在非复现性操作就会报错,并指示出相关操作。

加载数据

重点在于设置shuffle=False并且num_workers=0

    for (i, x_val) in enumerate(x_train):
        x_val = torch.tensor(x_train[i], dtype=torch.float)
        if link_load:
            y_val = torch.tensor(y_train[i].flatten(), dtype=torch.float)
        else:
            y_val = torch.tensor(y_train[i].flatten(), dtype=torch.int64)

        data = Data(x=x_val, y=y_val, edge_index=edge_index)
        train_dataset.append(data)

    train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=False, sampler=sampler, num_workers=0)

图神经网络可复现性

在使用PyG写图神经网络的时候遇到了data.edge_index在进入卷积层的时候会遇到scatter_add操作是不可复现的,所以这里使用torch_sparse.SparseTensor来代替可以解决。

    def forward(self, data):
        x, edge_index = data.x, data.edge_index

        edge_index = torch_sparse.SparseTensor(row=edge_index[0], col=edge_index[1])
  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值