极简Pytorch入门

叶筱

已于 2023-03-28 16:00:33 修改

阅读量323

点赞数

文章标签： pytorch 人工智能 python

于 2023-03-28 15:39:07 首次发布

本文链接：https://blog.csdn.net/qq_34373560/article/details/129817512

版权

1.什么是Pytorch，为什么选择Pytroch？

PyTorch 是 PyTorch 在 Python 上的衍生。因为 PyTorch 是一个使用 PyTorch 语言的神经网络库, Torch 很好用, 但是 Lua 又不是特别流行（其实Lua是一门比Python还简单的语言）, 所有开发团队将 Lua 的 Torch 移植到了更流行的语言 Python 上，使其能够发挥出更大的价值。当今世界，著名的 Facebook、twitter、Google、Microsoft 等公司都在使用它, 足以见得Pytorch的确好用。
以下是常见的一些深度学习框架，具体就不赘述了：

以上详细介绍见：常见深度学习框架简介

2.通过命令行安装PyTorch

我们只需要访问https://pytorch.org/既可以轻松获取安装途径。

这里我采用的是Windows平台下Python3.7的Pip稳定版安装（附带GPU加速）
在命令行中粘贴以下内容即可安装

pip3 install https://download.pytorch.org/whl/cu100/torch-1.1.0-cp37-cp37m-win_amd64.whl
pip3 install torchvision

3.配置Python环境

安装Python时勾选添加到PATH即可，也可以手动操作，尤其是我们需要同时安装两个不同的版本（不用虚拟环境）时，需要多注意环境配置问题！
多版本可以参考以下资料配置环境：
多版本Python共存的配置和使用
Windows10下解决多个版本Python共存问题初探

4.PyTorch基础概念

PyTorch 是一个建立在 Torch 库之上的 Python 包，旨在加速深度学习应用。
PyTorch 提供一种类似 NumPy 的抽象方法来表征张量（或多维数组,标量是零级张量、向量是一阶张量，矩阵是二阶张量），它可以利用 GPU 来加速训练。在神经网络中Torch可以替换Numpy。
而PyTorch相比TensorFlow，其最大的优点是建立的神经网络是动态的，相比静态的TensorFlow，它能更加有效地去处理一些问题，比如RNN变化时间长度的输出，TensorFlow相比PyTorch的有点在于分布式训练上。
Vector:向量/Matrix:矩阵/Tensor:张量

Tensor和Numpy之间的转换（Numpy桥）

import torch
import numpy as np
 
np_data = np.arange(6).reshape((2, 3))
torch_data = torch.from_numpy(np_data)
tensor2array = torch_data.numpy()
print(
    '\nnumpy', np_data,
    '\ntorch', torch_data,
    '\ntensor2array', tensor2array
)

运行结果：

numpy [[0 1 2]
 [3 4 5]] 
torch tensor([[0, 1, 2],
        [3, 4, 5]], dtype=torch.int32) 
tensor2array [[0 1 2]
 [3 4 5]]

再说几个重点：

张量（Tensor）是线性代数中的一种数据结构，是向量和矩阵的推广，我们可以在张量上进行算术运算。参考文档：什么是张量？

import torch 
x = torch.ones(2,3,4) 
print(x)

输出：

tensor([[[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]],

       [[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]]])

Tensor与numpy的Array之间的相互转换时,要时刻注意Tensor和numpy的Array共享潜在的内存，改变其中任一值，另外一个也会相应改变
如果安装了GPU版(CUDA张量)的Pytorch，可将张量转移到GPU上进行计算,从而可以提高运算效率

可参考笔记：Torch or Numpy

5.完成一个深度学习的代码

1>建立数据集（并绘制图像）

# -*- coding: utf-8 -*-
#demo.py
import torch
import torch.nn.functional as F  # 主要实现激活函数
import matplotlib.pyplot as plt  # 绘图的工具
from torch.autograd import Variable
# 生成伪数据
x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1)
y = x.pow(3) + 0.2*torch.rand(x.size())    #y=x³+b

# 变为Variable
x, y = Variable(x), Variable(y)

# 绘制数据图像
plt.scatter(x.data.numpy(), y.data.numpy())
plt.show()

其中torch.linspace是为了生成连续间断的数据，第一个参数表示起点，第二个参数表示终点，第三个参数表示将这个区间分成平均几份，即生成几个数据。因为torch只能处理二维的数据，所以我们用torch.unsqueeze给伪数据添加一个维度，dim表示添加在第几维。torch.rand返回的是[0,1)之间的均匀分布。

得到下图：

2>建立神经网络

lass Net(torch.nn.Module):    # 继承 torch 的 Module
    def __init__(self, n_feature, n_hidden, n_output):
        super(Net, self).__init__()   # 继承 __init__ 功能
        self.hidden = torch.nn.Linear(n_feature, n_hidden)   # 隐藏层线性输出
        self.predict = torch.nn.Linear(n_hidden, n_output)   # 输出层线性输出

    def forward(self, x):
        x = F.relu(self.hidden(x))       # 激励函数(隐藏层的线性值)
        x = self.predict(x)             # 输出值
        return x

net = Net(n_feature=1, n_hidden=10, n_output=1)     # 定义神经网络
print(net)  # net 的结构

一般神经网络的类都继承自torch.nn.Module，__init__()和forward()两个函数是自定义类的主要函数。在__init__()中都要添加一句super(Net, self).__init__()，这是固定的标准写法，用于继承父类的初始化函数。__init__()中只是对神经网络的模块进行了声明，真正的搭建是在forwad()中实现。自定义类中的成员都通过 self指针来进行访问，所以参数列表中都包含了self。

3>训练神经网络（并可视化训练过程）

# optimizer 是训练的工具
optimizer = torch.optim.SGD(net.parameters(), lr=0.2)  # 传入 net 的所有参数, 学习率
loss_func = torch.nn.MSELoss()      # 预测值和真实值的误差计算公式 (均方差)

# 训练100次
for t in range(100):
    prediction = net(x)      # 喂给 net 训练数据 x, 输出预测值

    loss = loss_func(prediction, y)     #计算两者的误差，一定要是输出在前，标签在后 (1. nn output, 2. target)

    optimizer.zero_grad()   # 清空上一步的残余更新参数值
    loss.backward()         # 误差反向传播, 计算参数更新值
    optimizer.step()        # 将参数更新值施加到 net 的 parameters 上

plt.ion()   # 画图

训练网络之前我们需要先定义优化器和损失函数。torch.optim包中包括了各种优化器，这里我们选用最常见的SGD作为优化器。因为我们要对网络的参数进行优化，所以我们要把网络的参数net.parameters()传入优化器中，并设置学习率（一般小于1）。由于这里是回归任务，我们选择torch.nn.MSELoss()作为损失函数。由于优化器是基于梯度来优化参数的，并且梯度会保存在其中。所以在每次优化前要通过optimizer.zero_grad()把梯度置零，然后再后向传播及更新。

可视化训练过程：

for t in range(100):

    ...
    loss.backward()
    optimizer.step()
    if t % 5 == 0:
        # plot and show learning process
        plt.cla()
        plt.scatter(x.data.numpy(), y.data.numpy())
        plt.plot(x.data.numpy(), prediction.data.numpy(), 'r-', lw=5)
        plt.text(0.5, 0, 'Loss=%.4f' % loss.data[0], fontdict={'size': 20, 'color':  'red'})
        plt.pause(0.1)

plt.ioff()
plt.show()

###摘取了几个过程：

###最终结果：

参考文档：
基于pytorch的简易卷积神经网络结构搭建-卷积神经网络（CNN）浅析
 卷积神经网络CNN入门[pytorch学习]

叶筱

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
极简Pytorch入门

PyTorch 是 PyTorch 在 Python 上的衍生。因为 PyTorch 是一个使用 PyTorch 语言的神经网络库, Torch 很好用, 但是 Lua 又不是特别流行（其实Lua是一门比Python还简单的语言）, 所有开发团队将 Lua 的 Torch 移植到了更流行的语言 Python 上，使其能够发挥出更大的价值。当今世界，著名的 Facebook、twitter、Google、Microsoft 等公司都在使用它, 足以见得Pytorch的确好用。
复制链接

扫一扫