第一节：pytorch的基础

最新推荐文章于 2024-05-05 11:20:56 发布

Marshal～

最新推荐文章于 2024-05-05 11:20:56 发布

阅读量89

点赞数

分类专栏： pytorch

本文链接：https://blog.csdn.net/M_arshal_/article/details/115795602

版权

pytorch 专栏收录该内容

15 篇文章 1 订阅

订阅专栏

1、pytorch和numpy

（1）可以相互转化

import torch
import numpy as np

np_data = np.arange(6).reshape((2, 3))
torch_data = torch.from_numpy(np_data)
tensor2array = torch_data.numpy()
print(
    '\nnumpy array:', np_data,          # [[0 1 2], [3 4 5]]
    '\ntorch tensor:', torch_data,      #  0  1  2 \n 3  4  5    [torch.LongTensor of size 2x3]
    '\ntensor to array:', tensor2array, # [[0 1 2], [3 4 5]]
)

a） np.arange(6).reshape((2,3))构建一个[[0 1 2], [3 4 5]]的numpy矩阵
b） torch.from_numpy(np_data) 将numpy数据转化为torch
c) torch_data.numpy()直接将torch数据nunmpy化
（2）数学运算比较

# abs 绝对值计算
data = [-1, -2, 1, 2]
tensor = torch.FloatTensor(data)  # 转换成32位浮点 tensor
print(
    '\nabs',
    '\nnumpy: ', np.abs(data),          # [1 2 1 2]
    '\ntorch: ', torch.abs(tensor)      # [1 2 1 2]
)

# sin   三角函数 sin
print(
    '\nsin',
    '\nnumpy: ', np.sin(data),      # [-0.84147098 -0.90929743  0.84147098  0.90929743]
    '\ntorch: ', torch.sin(tensor)  # [-0.8415 -0.9093  0.8415  0.9093]
)

# mean  均值
print(
    '\nmean',
    '\nnumpy: ', np.mean(data),         # 0.0
    '\ntorch: ', torch.mean(tensor)     # 0.0
)

矩阵乘法

# matrix multiplication 矩阵点乘
data = [[1,2], [3,4]]
tensor = torch.FloatTensor(data)  # 转换成32位浮点 tensor
# correct method
print(
    '\nmatrix multiplication (matmul)',
    '\nnumpy: ', np.matmul(data, data),     # [[7, 10], [15, 22]]
    '\ntorch: ', torch.mm(tensor, tensor)   # [[7, 10], [15, 22]]
)

# !!!!  下面是错误的方法 !!!!
data = np.array(data)
print(
    '\nmatrix multiplication (dot)',
    '\nnumpy: ', data.dot(data),        # [[7, 10], [15, 22]] 在numpy 中可行
    '\ntorch: ', tensor.dot(tensor)     # torch 会转换成 [1,2,3,4].dot([1,2,3,4) = 30.0
)

在tensor中矩阵的乘法不用.dot 因为这样会直接计算出值而不是矩阵。

2、variable变量

（1）variable的概念：
在这里我的理解：（以回归拟合举例子）
tensor是一个一个的点，而你要回归拟合，必须不断的调整线的“弯曲程度”（梯度）。这里用tensor无法返回梯度，也就无法进行调节拟合。
而variable就是一个带有方向导数（梯度的点），variable的值与tensor相等，但是他还计算了梯度值，也就可以反向传递了。

import torch
from torch.autograd import Variable # torch 中 Variable 模块

# 先生鸡蛋
tensor = torch.FloatTensor([[1,2],[3,4]])
# 把鸡蛋放到篮子里, requires_grad是参不参与误差反向传播, 要不要计算梯度
variable = Variable(tensor, requires_grad=True)

print(tensor)
"""
 1  2
 3  4
[torch.FloatTensor of size 2x2]
"""

print(variable)
"""
Variable containing:
 1  2
 3  4
[torch.FloatTensor of size 2x2]
"""

（2）对variable的计算和tensor的计算

时刻记住, Variable 计算时, 它在背景幕布后面一步步默默地搭建着一个庞大的系统, 叫做计算图, computational graph. 这个图是用来干嘛的? 原来是将所有的计算步骤 (节点) 都连接起来, 最后进行误差反向传递的时候, 一次性将所有 variable 里面的修改幅度 (梯度) 都计算出来, 而 tensor 就没有这个能力啦.

暂且存疑的个人解读：
//个人解读：要进行精确的拟合不仅仅需要各个点的信息（梯度），随着拟合调整是会不断变化的，所以这里还需要进行整体把握。//
（3）variable的数据
很多时候是用不了的，因为他是一个“向量”，不能直接提取数据，需要转换为tensor或则numpy

print(variable)     #  Variable 形式
"""
Variable containing:
 1  2
 3  4
[torch.FloatTensor of size 2x2]
"""

print(variable.data)    # tensor 形式
"""
 1  2
 3  4
[torch.FloatTensor of size 2x2]
"""

print(variable.data.numpy())    # numpy 形式
"""
[[ 1.  2.]
 [ 3.  4.]]
"""

！！！！！事实上tensor是张量，是在各个方向上的维度：向量、矩阵、各个维度带有方向的值。那么这里可能variable就是一个大的容器，可以同时进行各个点梯度变化时候的整体把握！！！！！

激励函数

（1）定义：就是一个可微分的非线性函数
（2）使用规则：隐藏层少那么随便使用即可，如果隐藏层很多那么必须谨慎使用否则可能产生梯度爆炸。

比如当你的神经网络层只有两三层, 不是很多的时候, 对于隐藏层, 使用任意的激励函数, 随便掰弯是可以的, 不会有特别大的影响. 不过, 当你使用特别多层的神经网络, 在掰弯的时候, 玩玩不得随意选择利器. 因为这会涉及到梯度爆炸, 梯度消失的问题. 因为时间的关系, 我们可能会在以后来具体谈谈这个问题.

（3）几个常见的激励函数

import torch
import torch.nn.functional as F     # 激励函数都在这
from torch.autograd import Variable

# 做一些假数据来观看图像
x = torch.linspace(-5, 5, 200)  # x data (tensor), shape=(100, 1)
x = Variable(x)
x_np = x.data.numpy()   # 换成 numpy array, 出图时用

# 几种常用的 激励函数
y_relu = F.relu(x).data.numpy()
y_sigmoid = F.sigmoid(x).data.numpy()
y_tanh = F.tanh(x).data.numpy()
y_softplus = F.softplus(x).data.numpy()
# y_softmax = F.softmax(x)  softmax 比较特殊, 不能直接显示, 不过他是关于概率的, 用于分类