《PyTorch 深度学习实践》第7讲处理多维特征的输入

铃之

已于 2023-04-13 10:06:00 修改

阅读量191

点赞数

分类专栏：《PyTorch深度学习实践》刘二大人文章标签： python 机器学习深度学习

于 2023-04-07 00:34:04 首次发布

本文链接：https://blog.csdn.net/m0_56676945/article/details/130002565

版权

《PyTorch深度学习实践》刘二大人专栏收录该内容

12 篇文章 18 订阅

订阅专栏

简单示例：糖尿病数据集（二分类）

import torch
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split

# 1、划分训练集和测试集。标签为二分类0 1
data = np.loadtxt('../Data/diabetes.csv.gz', delimiter=',', dtype=np.float32)
print("data.shape:", data.shape)
X_train, X_test, Y_train, Y_test = train_test_split(data[:, :-1], data[:, -1], test_size=0.3, random_state=46)
x_train = torch.tensor(X_train)
y_train = torch.tensor(Y_train).reshape(Y_train.shape[0], 1)  # 转成二维
x_test = torch.tensor(X_test)
y_test = torch.tensor(Y_test).reshape(Y_test.shape[0], 1)


# 2、用类设计模型
class Model(torch.nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.linear1 = torch.nn.Linear(8, 6)  # 输入维度为8，即特征数。输出维度为6
        self.linear2 = torch.nn.Linear(6, 4)
        self.linear3 = torch.nn.Linear(4, 1)
        self.activate = torch.nn.Sigmoid()

    def forward(self, x):
        x = self.activate(self.linear1(x))
        x = self.activate(self.linear2(x))
        x = self.activate(self.linear3(x))  # 经过三层的变换
        return x


model = Model()

# 3、构造损失和优化器
criterion = torch.nn.BCELoss(reduction='mean')
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

loss_list = []
# 4、用训练集训练模型
for epoch in range(100000):
    # Forward
    y_pred = model(x_train)
    loss = criterion(y_pred, y_train)
    loss_list.append(loss.item())
    # print(epoch, loss.item())

    # Backward
    optimizer.zero_grad()
    loss.backward()

    # Update
    optimizer.step()

print("The minimum loss:", min(loss_list))
plt.plot(loss_list)
plt.grid()
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.show()

data.shape: (759, 9)
The minimum loss: 0.4665030241012573

在这里插入图片描述

上面图像竟然是这样！刚开始epoch只随便设置几千，普普通通没啥意思。后面想着搞点大的，随着次数增多，损失在40000时附近迅速下降，神奇。同学们，探索精神懂不懂呀！

接下来用我们上面训练好的模型来检验其在测试集上的表现：

from sklearn.metrics import auc
from sklearn.metrics import roc_curve
import pandas as pd

y_pred = pd.DataFrame(model(x_test).detach().numpy())
fpr, tpr, thresholds = roc_curve(y_test.numpy(), y_pred, pos_label=1)
print(auc(fpr, tpr))
plt.plot(fpr, tpr, label='ROC (area = {0:.2f})'.format(auc(fpr, tpr)), lw=2)

# 绘制ROC曲线
plt.xlim([-0.05, 1.05])  # 设置x、y轴的上下限，以免和边缘重合，更好地观察图像的整体
plt.ylim([-0.05, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('ROC Curve')
plt.legend(loc=4)
plt.show()
# 曲线下方面积即auc值越大，模型效果越好。关于ROC曲线涉及混淆矩阵，相关内容以后再补充。

0.8488888888888889

在这里插入图片描述

y_pred.head(10)  # 模型返回的是预测y=1的概率

预测为1的概率
0.788377
0.582527
0.433012
0.433163
0.901173
0.722548
0.301493
0.923470
0.366946
0.659431

y_test.numpy()[:10]  # 真实值

array([[1.],
       [1.],
       [1.],
       [0.],
       [1.],
       [1.],
       [0.],
       [1.],
       [0.],
       [0.]], dtype=float32)

铃之

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《PyTorch 深度学习实践》第7讲处理多维特征的输入

上面图像竟然是这样！刚开始epoch只随便设置几千，普普通通没啥意思。后面想着搞点大的，随着次数增多，损失在40000时附近迅速下降，神奇。
复制链接

扫一扫

专栏目录

《PyTorch 深度学习实践》第7讲 处理多维特征的输入

简单示例：糖尿病数据集（二分类）

《PyTorch 深度学习实践》第7讲处理多维特征的输入