pytorch9-微调VGG16网络(基于kaggle数据集识别10种猴)

import hiddenlayer as hl
import torch
import torch.nn as nn
from torch.optim import SGD, Adam
import torch.utils.data as Data
from torchvision import models
from torchvision import transforms
from torchvision.datasets import ImageFolder

# 导入预训练好的vgg16网络
vgg16 = models.vgg16(pretrained=True)

# 获取vgg16特征提取层
vgg = vgg16.features
# 将vgg16的特征提取层参数冻结不对其进行更新
for param in vgg.parameters():
    param.requires_grad_(False)


# 使用vgg16的特征提取层+其他的层自己创建新的网络
class MyVggModel(nn.Module):
    def __init__(self):
        super(MyVggModel, self).__init__()  # 对继承自父类的属性进行初始化
        self.vgg = vgg  # 调用vgg16网络
        # 添加新的全连接层
        self.classifier = nn.Sequential(
            nn.Linear(25088, 512),
            nn.ReLU(),
            nn.Dropout(p=0.5),
            nn.Linear(512, 256),
            nn.ReLU(),
            nn.Dropout(p=0.5),
            nn.Linear(256, 10),
            nn.Softmax(dim=1)
        )

    # 定义网络的前向传播途径
    def forward(self, x):
        x = self.vgg(x)
        x = x.view(x.size(0), -1)
        output = self.classifier(x)
        return output


if __name__ == "__main__":
    # 实例化一个网络
    Myvggc = MyVggModel()
    # print(Myvggc)

    # 使用10类猴子的数据集,对训练集预处理----将各种操作用compose集合起来
    train_data_transforms = transforms.Compose([
        transforms.RandomResizedCrop(224),  # 随机长宽比裁剪为224*224
        transforms.RandomHorizontalFlip(),  # 依照概率p=0.5水平翻转
        transforms.ToTensor(),  # 转化为张量并归一化处理至0-1
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ])

    # 对验证集进行预处理
    val_data_transfronms = transforms.Compose([
        transforms.Resize(256),  # 重置图像分辨率
        transforms.CenterCrop(224), # 依据给定的大小从中间裁剪
        transforms.ToTensor(),# 转化为张量并归一化
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) # 图像标准化处理
    ])

    #加载训练数据,使用对应的数据加载器
    train_data_dir = "data/monkey-species/training/training"
    train_data = ImageFolder(train_data_dir, transform=train_data_transforms)
    train_data_loader = Data.DataLoader(train_data, batch_size=32, shuffle=True, num_workers=2)

    # 加载验证数据集,使用对应的数据加载器
    val_data_dir = "data/monkey-species/validation/validation"
    val_data = ImageFolder(val_data_dir, transform=val_data_transfronms)
    val_data_loader = Data.DataLoader(val_data, batch_size=32, shuffle=True, num_workers=2)
    print("训练集样本:", train_data)

    print("训练集样本数:", len(train_data.targets))
    print("验证集样本数:", len(val_data.targets))

    # for step, (b_x, b_y) in enumerate(train_data_loader):
    #     if step > 0:
    #         break
    #
    #     mean = np.array([0.485, 0.456, 0.406])
    #     std = np.array([0.229, 0.224, 0.225])
    #     plt.figure(figsize=(12, 6))
    #     print("b_y", b_y)
    #     for ii in np.arange(len(b_y)):
    #         print("len(b_y)", len(b_y))
    #         print("ii:", ii)
    #         plt.subplot(4, 8, ii + 1)
    #         image = b_x[ii, :, :, :].numpy().transpose((1, 2, 0))
    #         image = std * image + mean
    #         image = np.clip(image, 0, 1)
    #         plt.imshow(image)
    #         plt.title(b_y[ii].data.numpy())
    #         plt.axis("off")
    #     plt.subplots_adjust(hspace=0.3)
    # #plt.show()

    # 定义优化器和损失函数
    optimizer = torch.optim.Adam(Myvggc.parameters(), lr=0.003)
    loss_func = nn.CrossEntropyLoss()  # 损失函数

    # 记录训练过程的指标
    history1 = hl.History()
    # 使用canvas将训练数据可视化
    canvas1 = hl.Canvas()

    # 对模型进行训练,对所有的数据训练epoch轮
    for epoch in range(10):
        # 每个epoch前初始化数据
        train_loss_epoch = 0
        val_loss_epoch = 0
        train_correct = 0
        val_correct = 0

        # 对训练数据的加载器进行迭代训练
        Myvggc.train()
        # 对每个batch的数据进行训练
        for step, (b_x, b_y) in enumerate(train_data_loader):
            # 计算每个batch的损失
            output = Myvggc(b_x)
            loss = loss_func(output, b_y)
            pre_lab = torch.argmax(output, 1)
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            train_loss_epoch += loss.item() * b_x.size(0)
            train_correct += torch.sum(pre_lab == b_y.data)
        # 计算一个epoch的损失和精度
        train_loss = train_loss_epoch / len(train_data.targets)
        train_acc = train_correct.double() / len(train_data.targets)


        # 计算在验证集上的表现
        Myvggc.eval()
        for step, (val_x, val_y) in enumerate(val_data_loader):
            output = Myvggc(val_x)
            loss = loss_func(output, val_y)
            pre_lab = torch.argmax(output, 1)
            val_loss_epoch += loss.item() * val_x.size(0)
            val_correct += torch.sum(pre_lab == val_y.data)
        # 计算一个batch 的损失和精度
        val_loss = val_loss_epoch / len(val_data.targets)
        val_acc = val_correct.double() / len(val_data.targets)

        # 保存每个batch上的损失和精度
        history1.log(epoch, train_loss=train_loss,
                     val_loss=val_loss,
                     train_acc=train_acc.item(),
                     val_acc=val_acc.item()
                     )
        # 可视化网络训练过程
        with canvas1:
            canvas1.draw_plot([history1["train_loss"], history1["val_loss"]])
            canvas1.draw_plot([history1["train_acc"], history1["val_acc"]])

 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PyTorch是一种流行的深度学习框架,用于构建和训练神经网络。通过使用PyTorch框架,我们可以对花的种类进行识别。为了训练我们的模型,我们可以使用Kaggle数据集中提供的图片和标签。 首先,我们需要导入PyTorch库以及其他必要的依赖项,并设置训练和测试的超参数,如批处理大小、学习率和训练时的迭代次数。 接下来,我们可以使用PyTorch的数据加载器来加载训练和测试数据集。我们可以将训练集和测试集的图像和对应的标签存储在列表或张量中。我们还可以使用数据增强技术来生成更多的训练样本,例如随机旋转、缩放和翻转图像。 然后,我们需要定义我们的神经网络模型。我们可以使用预训练的卷积神经网络(如ResNet、Inception等)作为特征提取器,然后将其与全连接层组合,最后输出类别预测。我们可以选择解冻部分或全部的卷积层,并在训练过程中进行微调。 接下来,我们可以选择适当的损失函数,如交叉熵损失函数,以及优化算法,如随机梯度下降(SGD)或Adam。我们将利用训练数据集来最小化损失函数,并根据验证集的表现进行模型选择和调整超参数。 最后,我们可以使用测试数据集来评估模型的性能。我们将计算模型在测试数据集上的预测结果,并与真实标签进行比较,以计算准确率、精确率、召回率等评估指标。 总结来说,使用PyTorch框架和Kaggle数据集,我们可以构建一个用于花种类识别的神经网络模型。我们将从数据加载开始,定义模型结构和超参数,训练模型并评估其性能。这样,我们就可以使用源码进行花种类的识别

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值