《深度学习框架PyTorch：入门与实践》学习笔记第二章

最新推荐文章于 2023-09-07 15:22:10 发布

深度瞎学

最新推荐文章于 2023-09-07 15:22:10 发布

阅读量199

点赞数

分类专栏：深度学习学习笔记

本文链接：https://blog.csdn.net/weixin_44438120/article/details/106438049

版权

深度学习学习笔记专栏收录该内容

12 篇文章 4 订阅

订阅专栏

Tensor和numpy对象共享内存，所以他们之间的转换很快，而且几乎不会消耗什么资源。但这也意味着，如果其中一个变了，另外一个也会随之改变。

b.add_(2) # 以`_`结尾的函数会修改自身
print(a)
print(b) # Tensor和Numpy共享内存
[4. 4. 4. 4. 4.] # b原有数组为[2.2.2.2.2.]
tensor([4., 4., 4., 4., 4.], dtype=torch.float64)

t.tensor()或者tensor.clone()总是会进行数据拷贝，新tensor和原来的数据不再共享内存。所以如果你想共享内存的话，建议使用torch.from_numpy()或者tensor.detach()来新建一个tensor, 二者共享内存。

new_tensor = old_tensor.detach()
new_tensor[0] = 1111
old_tensor, new_tensor
(tensor([1111,    4]), tensor([1111,    4]))

从0.4起, Variable 正式合并入Tensor, Variable 本来实现的自动微分功能，Tensor就能支持。读者还是可以使用Variable(tensor), 但是这个操作其实什么都没做。建议读者以后直接使用tensor.要想使得Tensor使用autograd功能，只需要设置tensor.requries_grad=True.

# 为tensor设置 requires_grad 标识，代表着需要求导数
# pytorch 会自动调用autograd 记录操作
x = t.ones(2, 2, requires_grad=True)

# 上一步等价于
# x = t.ones(2,2)
# x.requires_grad = True

x
tensor([[1., 1.],
        [1., 1.]], requires_grad=True)

注意：grad在反向传播过程中是累加的(accumulated)，这意味着每一次运行反向传播，梯度都会累加之前的梯度，所以反向传播之前需把梯度清零。

# 以下划线结束的函数是inplace操作，会修改自身的值，就像add_
x.grad.data.zero_()
tensor([[0., 0.],
        [0., 0.]])

定义网络时，需要继承nn.Module，并实现它的forward方法，把网络中具有可学习参数的层放在构造函数__init__中。如果某一层(如ReLU)不具有可学习的参数，则既可以放在构造函数中，也可以不放，但建议不放在其中，而在forward中使用nn.functional代替。

import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):
    def __init__(self):
        # nn.Module子类的函数必须在构造函数中执行父类的构造函数
        # 下式等价于nn.Module.__init__(self)
        super(Net, self).__init__()
        
        # 卷积层 '1'表示输入图片为单通道, '6'表示输出通道数，'5'表示卷积核为5*5
        self.conv1 = nn.Conv2d(1, 6, 5) 
        # 卷积层
        self.conv2 = nn.Conv2d(6, 16, 5) 
        # 仿射层/全连接层，y = Wx + b
        self.fc1   = nn.Linear(16*5*5, 120) 
        self.fc2   = nn.Linear(120, 84)
        self.fc3   = nn.Linear(84, 10)

    def forward(self, x): 
        # 卷积 -> 激活 -> 池化 
        x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))
        x = F.max_pool2d(F.relu(self.conv2(x)), 2) 
        # reshape，‘-1’表示自适应
        x = x.view(x.size()[0], -1) 
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)        
        return x

net = Net()
print(net)

只要在nn.Module的子类中定义了 forward函数，backward函数就会自动被实现(利用autograd)。在forward 函数中可使用任何tensor支持的函数，还可以使用if、for循环、print、log等Python语法，写法和标准的Python写法一致。

网络的可学习参数通过net.parameters()返回，net.named_parameters可同时返回可学习的参数及名称。

params = list(net.parameters())
print(len(params))
10
for name,parameters in net.named_parameters():
    print(name,':',parameters.size())
conv1.weight : torch.Size([6, 1, 5, 5])
conv1.bias : torch.Size([6])
conv2.weight : torch.Size([16, 6, 5, 5])
conv2.bias : torch.Size([16])
fc1.weight : torch.Size([120, 400])
fc1.bias : torch.Size([120])
fc2.weight : torch.Size([84, 120])
fc2.bias : torch.Size([84])
fc3.weight : torch.Size([10, 84])
fc3.bias : torch.Size([10])

深度瞎学

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《深度学习框架PyTorch：入门与实践》学习笔记第二章

Tensor和numpy对象共享内存，所以他们之间的转换很快，而且几乎不会消耗什么资源。但这也意味着，如果其中一个变了，另外一个也会随之改变。b.add_(2) # 以`_`结尾的函数会修改自身print(a)print(b) # Tensor和Numpy共享内存[4. 4. 4. 4. 4.] # b原有数组为[2.2.2.2.2.]tensor([4., 4., 4., 4., 4.], dtype=torch.float64)t.tensor()或者tensor.clone()总是.
复制链接

扫一扫

专栏目录