神经网络-非线性激活

概述:

非线性激活主要是为了给我们的神经网络去引入一些非线性的特质,比较常用的非线性激活有两个分别是SigmoidRELU

RELU

示例代码:

import torch
from torch import nn
from torch.nn import ReLU

input = torch.tensor([[1,-0.5],
                      [-1,3]])

input = torch.reshape(input,(-1,1,2,2))
print(input.shape)

# 搭建神经网络
class Booze(nn.Module):

    def __init__(self):
        super(Booze, self).__init__()
        # inplace参数的意义就是是否将原来的变量的值替换成处理后的结果值 若inplace=True则对原来的变量进行替换,原来变量的值就变了,变成处理后的结果值,若inplace=False则不对原来的变量进行替换,产生的结果需要一个新的变量去接收
        # 通常情况下,建议将inplace传入False,这样可以保证原始数据不丢失
        self.relu1 = ReLU()
	# 重写forword方法
    def forward(self,input):
        output = self.relu1(input)
        return output

obj = Booze()
output = obj(input)
print(output)

代码运行结果:
在这里插入图片描述

对于ReLU接口的使用,该接口只有一个参数需要传入,那就是inplace参数。

torch.nn.ReLU(inplace=False)

inplace参数的意义就是是否将原来的变量的值替换成处理后的结果值 若inplace=True则对原来的变量进行替换,原来变量的值就变了,变成处理后的结果值,若inplace=False则不对原来的变量进行替换,产生的结果需要一个新的变量去接收。
通常情况下,建议将inplace传入False,这样可以保证原始数据不丢失。
在这里插入图片描述
上面这张图是ReLU激活函数的图像,对上面这张图的解释:小于零进行截断,大于零则输出原有值。

Sigmoid

示例代码:

import torch
import torchvision
from torch import nn
from torch.nn import ReLU, Sigmoid
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter


dataset = torchvision.datasets.CIFAR10("./CIFAR10",train=False,transform=torchvision.transforms.ToTensor(),download=True)
dataloader = DataLoader(dataset,batch_size=64)

# 搭建神经网络
class Booze(nn.Module):

    def __init__(self):
        super(Booze, self).__init__()
        # inplace参数的意义就是是否将原来的变量的值替换成处理后的结果值 若inplace=True则对原来的变量进行替换,原来变量的值就变了,变成处理后的结果值,若inplace=False则不对原来的变量进行替换,产生的结果需要一个新的变量去接收
        # 通常情况下,建议将inplace传入False,这样可以保证原始数据不丢失
        self.relu1 = ReLU()
        self.sigmoid1 = Sigmoid()

    # 重写forward方法
    def forward(self,input):
        # output = self.relu1(input)
        output = self.sigmoid1(input)
        return output

obj = Booze()

# 使用tensorboard进行可视化
writer = SummaryWriter('logs')
step = 0

for data in dataloader:
    imgs,targets = data
    writer.add_images("input",imgs,step)
    # 使用神经网络对图片进行处理
    output = obj(imgs)
    writer.add_images("output",output,step)

    step+=1

writer.close()

SigmoidRELU的使用方法类似这里就不再赘述。
上述代码运行结果在tensorboard中可视化如下图所示:
在这里插入图片描述
非线性激活sigmoid函数处理前后的效果还是比较明显的哈。

总结

非线性变换主要目的就是在我们的网络当中去引入一些非线性特征。因为非线性也多的话,你才能训练出符合各种曲线或者说符合各种特征的一个模型,如果大家都是直愣愣的话,模型的泛化能力就不够好。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

布兹学长

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值