非线性激活

最新推荐文章于 2024-07-19 16:12:05 发布

哆啦蒙圈

最新推荐文章于 2024-07-19 16:12:05 发布

阅读量298

点赞数 7

分类专栏：小土堆 Pytorch基础文章标签： pytorch 深度学习

本文链接：https://blog.csdn.net/2303_79419613/article/details/138662234

版权

小土堆 Pytorch基础专栏收录该内容

11 篇文章 1 订阅

订阅专栏

引言：

非线性激活函数是在神经网络中使用的一种函数，它的作用是引入非线性特性，使得神经网络可以学习和表示更加复杂的函数关系。在神经网络中，激活函数通常被应用于每个神经元的输出，将输入信号进行转换后输出给下一层。

常见的两个函数：

Sigmoid函数：
- 将输入值映射到(0, 1)之间，适合用于输出层二分类任务，但在深层网络中容易出现梯度消失的问题。

ReLU函数
- 当输入为正时，输出等于输入；当输入为负时，输出为0。ReLU函数解决了梯度消失的问题，并且计算简单，因此在深度学习中广泛应用。

以ReLU函数为例：

ReLU函数的相关参数：

inplace：表示将是否将数据进行替换；

如图，如果 inplace 的值为True的话，新的值就会将旧的值进行覆盖；如果是False的话，就会将新的值返回，而不会将旧的数据覆盖，False保证了旧数据不会丢失；

代码示例：

import torch
import torchvision.datasets
from torch import nn
from torch.nn import ReLU, Sigmoid
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

input = torch.tensor([[1, -0.5],
                      [-1, 3]])

input = torch.reshape(input, (-1, 1, 2, 2))
print(input.shape)

dataset = torchvision.datasets.CIFAR10("../data", train=False, download=True,
                                       transform=torchvision.transforms.ToTensor())

dataloader = DataLoader(dataset, batch_size=64)


class Module(nn.Module):
    def __init__(self):
        super(Module, self).__init__()
        self.relu1 = ReLU()
        self.sigmoid1 = Sigmoid()

    def forward(self, input):
        output = self.sigmoid1(input)
        return output


module = Module()

writer = SummaryWriter("./logs_relu")
step = 0

for data in dataloader:
    imgs, targets = data
    writer.add_images("input", imgs, step)
    output = module(imgs)
    writer.add_images("output", output, step)
    step += 1

writer.close()