深度学习中的seed是做什么的，一般怎样用？

最新推荐文章于 2025-03-27 16:38:02 发布

yiruzhao

最新推荐文章于 2025-03-27 16:38:02 发布

阅读量2.7k

点赞数 16

文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/SisterRu/article/details/139738622

版权

在深度学习中，随机数生成器的种子（seed）用于确保实验结果的可重复性。具体来说，种子在以下几个方面起到重要作用：

作用

初始化权重：神经网络的权重通常在训练开始时以随机方式初始化。使用相同的种子确保每次初始化得到相同的权重分布。
数据分割：在将数据集划分为训练集、验证集和测试集时，使用相同的种子确保每次划分结果相同。
数据增强：在数据增强（如随机裁剪、翻转、旋转等）过程中，使用相同的种子确保每次对图像进行相同的增强操作。
批处理顺序：在训练过程中，数据通常以随机顺序分批次输入模型。使用相同的种子确保每次训练批次顺序一致。
随机操作：任何其他随机操作（如 dropout、随机选择数据等）也会受到种子的影响。

如何使用种子

在不同的深度学习框架中，设置种子的方法略有不同。以下是Pytorch深度学习框架中设置种子的示例。在实际的深度学习项目中，你可以在脚本的开头设置随机种子，以确保实验的可重复性。例如：

PyTorch

import torch
import numpy as np
import random

def set_seed(seed):
    torch.manual_seed(seed)
    torch.cuda.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)  # 如果你使用多个GPU
    np.random.seed(seed)
    random.seed(seed)
    torch.backends.cudnn.deterministic = True  # 确保每次卷积操作的结果是确定性的
    torch.backends.cudnn.benchmark = False  # 使用确定性的算法

# 设置随机种子
set_seed(42)

# 后续的深度学习代码
# 初始化模型、数据集等

通过在训练脚本的开头设置随机种子，你可以确保每次运行代码时得到相同的初始化权重、数据划分和训练过程，从而使得实验结果可重复。这在调试和比较不同模型或超参数时尤为重要。

这段代码用于在 PyTorch 和相关的库中设置随机种子，以确保实验结果的可重复性。每次运行相同的代码时，能够生成相同的结果，这在调试和对比实验结果时尤为重要。

以下是代码的详细解释：

函数定义

def set_seed(seed):

定义了一个名为 set_seed 的函数，接收一个参数 seed，即你想要设置的随机种子。

设置 PyTorch 的 CPU 随机种子

torch.manual_seed(seed)

设置 PyTorch 在 CPU 上生成随机数的种子。这会影响 CPU 上的所有随机操作。

设置 PyTorch 的 GPU 随机种子

torch.cuda.manual_seed(seed)

设置 PyTorch 在当前 GPU 上生成随机数的种子。如果使用多张 GPU 卡，还需要设置所有 GPU 的种子。

设置 PyTorch 的所有 GPU 随机种子

torch.cuda.manual_seed_all(seed)

设置 PyTorch 在所有可用 GPU 上生成随机数的种子。这确保在多 GPU 环境下的随机数生成是可重复的。

设置 NumPy 的随机种子

np.random.seed(seed)

设置 NumPy 生成随机数的种子。这会影响 NumPy 的所有随机数生成函数，如 np.random.rand、np.random.randn 等。

设置 Python 内置随机数生成器的随机种子

random.seed(seed)

设置 Python 内置的 random 模块生成随机数的种子。这会影响所有使用 random 模块生成的随机数。

配置 PyTorch 的 CUDNN 后端

torch.backends.cudnn.deterministic = True
torch.backends.cudnn.benchmark = True

torch.backends.cudnn.deterministic = True: 这个设置使得 CUDA 的深度学习库 cuDNN 以确定性的方式运行，这意味着相同输入的卷积操作将产生相同的输出。这在某些情况下可能会降低性能，但可以确保结果的可重复性。
torch.backends.cudnn.benchmark = True: 这个设置会让 cuDNN 通过基准测试来选择卷积操作的最优算法，从而提升性能。请注意，这在某些情况下可能会影响结果的可重复性，因此在需要严格可重复性的实验中，可以设置为 False。