pytorch(一)

最新推荐文章于 2023-12-07 13:36:49 发布

既是张大牙更是张大侠

最新推荐文章于 2023-12-07 13:36:49 发布

阅读量140

点赞数

文章标签： pytorch 深度学习

本文链接：https://blog.csdn.net/qq_43689908/article/details/123494017

版权

张量

0维张量是数字，1维张量是向量，2维向量是矩阵，3维向量可以用来储存时间序列数据，股价，文本数据，彩色图片
4维可以表示图像集合 5维为视频

使用

注意：索引出来的结果与原数据共享内存，也即修改一个，另一个也会跟着修改
改变tensor大小或者形状可以用torch.view

自动求导

神经网络的核心包是autograd，为张量上的所有操作提供了自动求导机制，它是一个运行时定义的框架，意味着反向传播是根据大妈如何运行来决定的，并且每次迭代都是不同的。
torch.Tensor 是这个包的核心类。如果设置它的属性 .requires_grad 为 True，那么它将会追踪对于该张量的所有操作。当完成计算后可以通过调用 .backward()，来自动计算所有的梯度。这个张量的所有梯度将会自动累加到.grad属性。

模型定义

Model类是torch.nn模块里提供的一个模型构造类，是所有神经网络模块的积累，可以通过继承它来定义我们想要的模型。
pytorch模型定义主要包括两个部分，各个部分的初始化（init）；数据流向定义（forward
主要有三个模型定义方式：

Sequential
直接排列

import torch.nn as nn
net = nn.Sequential(
        nn.Linear(784, 256),
        nn.ReLU(),
        nn.Linear(256, 10), 
        )
print(net)

使用 OrderdeDict

import collections
import torch.nn as nn
net2 = nn.Sequential(collections.OrderedDict([
          ('fc1', nn.Linear(784, 256)),
          ('relu1', nn.ReLU()),
          ('fc2', nn.Linear(256, 10))
          ]))
print(net2)

ModuleList

net = nn.ModuleList([nn.Linear(784, 256), nn.ReLU()])
net.append(nn.Linear(256, 10)) # # 类似List的append操作
print(net[-1])  # 类似List的索引访问
print(net)

具体实现的时候要在forward函数里实现for循环

class model(nn.Module):
  def __init__(self, ...):
    self.modulelist = ...
    ...
    
  def forward(self, x):
    for layer in self.modulelist:
      x = layer(x)
    return x

ModuleDict
和上一个作用类似，只是它更能够方便的为神经网络层添加名字

net = nn.ModuleDict({
    'linear': nn.Linear(784, 256),
    'act': nn.ReLU(),
})
net['output'] = nn.Linear(256, 10) # 添加
print(net['linear']) # 访问

模型修改

比如，我们让renet做10分类问题

ResNet(
  (conv1): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
  (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (relu): ReLU(inplace=True)
  (maxpool): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
  (layer1): Sequential(
    (0): Bottleneck(
      (conv1): Conv2d(64, 64, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv3): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn3): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (downsample): Sequential(
        (0): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
        (1): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      )
    )
..............
  (avgpool): AdaptiveAvgPool2d(output_size=(1, 1))
  (fc): Linear(in_features=2048, out_features=1000, bias=True)
)

具体修改代码

from collections import OrderedDict
classifier = nn.Sequential(OrderedDict([('fc1', nn.Linear(2048, 128)),
                          ('relu1', nn.ReLU()), 
                          ('dropout1',nn.Dropout(0.5)),
                          ('fc2', nn.Linear(128, 10)),
                          ('output', nn.Softmax(dim=1))
                          ]))
    
net.fc = classifier

添加外部输入

class Model(nn.Module):
    def __init__(self, net):
        super(Model, self).__init__()
        self.net = net
        self.relu = nn.ReLU()
        self.dropout = nn.Dropout(0.5)
        self.fc_add = nn.Linear(1001, 10, bias=True)
        self.output = nn.Softmax(dim=1)
        
    def forward(self, x, add_variable):
        x = self.net(x)
        x = torch.cat((self.dropout(self.relu(x)), add_variable.unsqueeze(1)),1)
        x = self.fc_add(x)
        x = self.output(x)
        return x

import torchvision.models as models
net = models.resnet50()
model = Model(net).cuda()
outputs = model(inputs, add_var)

添加额外输出

class Model(nn.Module):
    def __init__(self, net):
        super(Model, self).__init__()
        self.net = net
        self.relu = nn.ReLU()
        self.dropout = nn.Dropout(0.5)
        self.fc1 = nn.Linear(1000, 10, bias=True)
        self.output = nn.Softmax(dim=1)
        
    def forward(self, x, add_variable):
        x1000 = self.net(x)
        x10 = self.dropout(self.relu(x1000))
        x10 = self.fc1(x10)
        x10 = self.output(x10)
        return x10, x1000

import torchvision.models as models
net = models.resnet50()
model = Model(net).cuda()
out10, out1000 = model(inputs, add_var)

模型保存与读取

模型保存主要是采用pkl,pt,pth三种格式
一个pytorch模型主要包含两个部分，模型结构和权重。

from torchvision import models
model = models.resnet152(pretrained=True)

# 保存整个模型
torch.save(model, save_dir)
# 保存模型权重
torch.save(model.state_dict, save_dir)

既是张大牙更是张大侠

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pytorch(一)

张量0维张量是数字，1维张量是向量，2维向量是矩阵，3维向量可以用来储存时间序列数据，股价，文本数据，彩色图片4维可以表示图像集合 5维为视频使用注意：索引出来的结果与原数据共享内存，也即修改一个，另一个也会跟着修改改变tensor大小或者形状可以用torch.view自动求导神经网络的核心包是autograd，为张量上的所有操作提供了自动求导机制，它是一个运行时定义的框架，意味着反向传播是根据大妈如何运行来决定的，并且每次迭代都是不同的。torch.Tensor 是这个包的核心类。如果设置
复制链接

扫一扫