Relu和dropout的理解

最新推荐文章于 2023-05-12 17:02:44 发布

jjw_zyfx

最新推荐文章于 2023-05-12 17:02:44 发布

阅读量1.2k

点赞数 2

分类专栏： pytorch python 学术论文文章标签： python pytorch 深度学习

本文链接：https://blog.csdn.net/jjw_zyfx/article/details/123264795

版权

python 同时被 3 个专栏收录

125 篇文章 2 订阅

订阅专栏

pytorch

69 篇文章 8 订阅

订阅专栏

学术论文

8 篇文章 1 订阅

订阅专栏

该代码示例展示了ReLU激活函数和Dropout正则化的应用。ReLU激活函数用于处理梯度消失问题，加快训练速度，它将负值置零以实现非线性转换。Dropout则通过以一定概率随机关闭神经元来防止过拟合，保持网络的泛化能力。在给定的示例中，Dropout以0.5的概率丢弃元素，确保期望值不变。

摘要由CSDN通过智能技术生成

先看代码

def dropout_layer(X, dropout):
    """该函数以dropout的概率丢弃张量输入X中的元素 """
    assert 0 <= dropout <= 1
    # 在本情况中，所有元素都被丢弃。
    if dropout == 1:
        return torch.zeros_like(X)   
    # 在本情况中，所有元素都被保留。即不用丢弃
    if dropout == 0:
        return X
    mask = (torch.randn(X.shape) > dropout).float()
    # 除以1-p是为了保证期望不变即 E(x) = P*0 + (1-p)*(X/(1-p)) 
    return mask * X / (1.0 - dropout)

x = torch.arange(-1.0, 1.0, 0.1, requires_grad=True)
print('x\n', x)
y = torch.relu(x) 
print('y\n', y)
print(dropout_layer(y, 0.5))

输出结果：

x
 tensor([-1.0000, -0.9000, -0.8000, -0.7000, -0.6000, -0.5000, -0.4000, -0.3000,
        -0.2000, -0.1000,  0.0000,  0.1000,  0.2000,  0.3000,  0.4000,  0.5000,
         0.6000,  0.7000,  0.8000,  0.9000], requires_grad=True)
y
 tensor([0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000,
        0.0000, 0.0000, 0.1000, 0.2000, 0.3000, 0.4000, 0.5000, 0.6000, 0.7000,
        0.8000, 0.9000], grad_fn=<ReluBackward0>)
tensor([0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000,
        0.0000, 0.0000, 0.0000, 0.0000, 0.6000, 0.8000, 1.0000, 0.0000, 1.4000,
        0.0000, 0.0000], grad_fn=<DivBackward0>)