pytorch中Dropout

最新推荐文章于 2025-09-19 03:11:40 发布

原创最新推荐文章于 2025-09-19 03:11:40 发布 · 702 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch

pytorch 专栏收录该内容

24 篇文章

订阅专栏

Dropout 是一种常用的正则化技术，用于防止神经网络过拟合。PyTorch 提供了 nn.Dropout 层来实现这一功能。

基本用法

torch.nn.Dropout(p=0.5, inplace=False)

参数说明：

p (float): 每个元素被置为0的概率（默认0.5）
inplace (bool): 是否原地操作（默认False）

工作原理

在前向传播时，Dropout 会以概率 p 随机将输入张量的某些元素置为0
未被置0的元素会被缩放为 1/(1-p) 倍（为了保持训练和测试时的期望值一致）
在评估模式（eval()）下，Dropout 层不会执行任何操作

在训练时，Dropout 的输出可以表示为：

其中 mm 是一个伯努利随机变量矩阵（元素为0或1），pp 是dropout概率。

在测试时，模型直接使用原始输入：

使用示例

1. 基本使用

import torch
import torch.nn as nn

# 创建Dropout层，置0概率为0.3
dropout = nn.Dropout(p=0.3)

# 创建一个随机输入
input = torch.randn(5, 3)
print("原始输入:\n", input)

# 训练模式下的输出
output = dropout(input)
print("\nDropout输出:\n", output)

2. 在神经网络中使用

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(784, 512)
        self.dropout = nn.Dropout(p=0.2)  # 20%的dropout
        self.fc2 = nn.Linear(512, 10)
        
    def forward(self, x):
        x = torch.relu(self.fc1(x))
        x = self.dropout(x)  # 应用dropout
        x = self.fc2(x)
        return x

3. 训练和评估模式切换

model = Net()

# 训练模式（启用dropout）
model.train()
output_train = model(torch.randn(1, 784))

# 评估模式（禁用dropout）
model.eval()
output_eval = model(torch.randn(1, 784))