PyTorch深度学习实践(五)

写在前面:线性模型已经学的差不多啦,现在开始学习逻辑回归问题!

1 分类问题

比如说对于一个十分类的问题,我们并不是要让最后的预测值等于1-10,而是对应每个分类得到概率,概率最大的就是我们最终的预测结果。

1.1 MNIST数据集

import torchvision
train_set = torchvision.datasets.MNIST(root='../dataset/mnist', train=True, download=True)
test_set = torchvision.datasets.MNIST(root='../dataset/mnist', train=False, download=True

1.2 The CIFAR-10 数据集

  • train set 50000
  • tesr set 10000
  • classes 10
import torchvision
train_set = torchvision.datasets.CIFAR10(root='../dataset/mnist', train=True, download=True)
test_set = torchvision.datasets.CIFAR10(root='../dataset/mnist', train=True, download=True)

2 Sigmoid函数

在这里插入图片描述
特点:

  • 都是[-1, 1]
  • 都是单调增

在这么多种Sigmoid函数中,logist函数是最出名的,很多模型中使用的都是logist函数。因此呢,就把logist称作sigmoid函数(约定俗成的叫法)

3 在线性模型中加入logis函数

在这里插入图片描述
为什么要加入logist?

  • 使得输出值在[-1, 1]之间
  • σ ( x ) \sigma(x) σx已经约定俗成为 sigmiod函数啦

4 BCE损失函数

  • 上面一个loss函数是用MSE计算的,用于解决线性模型
  • 下一个loss函数用以解决二分类问题(二分类的交叉熵BCE)
  • 都是值越小越好,表示预测值与真实值越接近
    在这里插入图片描述

5 logist回归和线性模型比较

在这里插入图片描述

  • 计算图中可以看出,多了一个sigma层
  • 并且在forward()中,响应的多了一步操作

6 BCE的loss函数计算

在这里插入图片描述

  • 这个地方没有算均值,应为对所有的样本都没算,所以并不影响最后的结果

7 代码

  • 可以直接运行

import torch
import torch.nn.functional as F  # 现在已经不需要这个了
import numpy as np
import matplotlib.pyplot as plt

# 这是一个二分类的问题,y的取值是0 或者 1
x_data = torch.Tensor([[1.0], [2.0], [3.0]])
y_data = torch.Tensor([[0], [0], [1]])


class LogisticRegressionModel(torch.nn.Module):
    def __init__(self):
        super(LogisticRegressionModel, self).__init__()
        self.linear = torch.nn.Linear(1, 1)

    def forward(self, x):
        y_pred = torch.sigmoid(self.linear(x))
        return y_pred


model = LogisticRegressionModel()


criterion = torch.nn.BCELoss(size_average=False)
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

for epoch in range(1000):
    y_pred = model(x_data)
    loss = criterion(y_pred, y_data)
    print(epoch, loss.item())

    optimizer.zero_grad()
    loss.backward()
    optimizer.step()


# 画图
x = np.linspace(0, 10, 200)
x_t = torch.Tensor(x).view((200, 1))
y_t = model(x_t)
y = y_t.data.numpy()
plt.plot(x, y)  # 画蓝色的线
plt.plot([0, 10], [0.5, 0.5], c='r')  # 画红色的线
plt.xlabel('Hours')
plt.ylabel('Probability of Pass')
plt.grid()
plt.show()

  • 输出情况:

在这里插入图片描述

7.1 np.linspace()函数

np.linspace(start, stop, num)

start:返回样本数据的开始点
stop:返回样本数据的结束点
num:生成的样本数据量,默认为50

7.2 网格线设置

plt.grid()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值