第P4周:使用PyTorch实现猴痘病识别

  •  🍨 本文为🔗365天深度学习训练营 中的学习记录博客
  • 🍖 原作者:K同学啊 | 接辅导、项目定制
    import torch
    import torch.nn as nn
    import torchvision.transforms as transforms
    import torchvision
    from torchvision import transforms, datasets
    import os,PIL,random,pathlib
    import matplotlib.pyplot as plt
    import warnings
    
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    data_dir = './data/'
    data_dir = pathlib.Path(data_dir)
    data_paths = list(data_dir.glob('*'))
    classeNames = [str(path).split("\\")[1] for path in data_paths]
    total_datadir = './data/'
    
    train_transforms = transforms.Compose([
        transforms.Resize([224, 224]),  # 将输入图片resize成统一尺寸
        transforms.ToTensor(),          # 将PIL Image或numpy.ndarray转换为tensor,并归一化到[0,1]之间
        transforms.Normalize(           # 标准化处理-->转换为标准正太分布(高斯分布),使模型更容易收敛
            mean=[0.485, 0.456, 0.406], 
            std=[0.229, 0.224, 0.225])  # 其中 mean=[0.485,0.456,0.406]与std=[0.229,0.224,0.225] 从数据集中随机抽样计算得到的。
    ])
    
    total_data = datasets.ImageFolder(total_datadir,transform=train_transforms)
    
    train_size = int(0.8 * len(total_data))
    test_size  = len(total_data) - train_size
    train_dataset, test_dataset = torch.utils.data.random_split(total_data, [train_size, test_size])
    train_dataset, test_dataset
    
    batch_size = 32
    
    train_dl = torch.utils.data.DataLoader(train_dataset,
                                               batch_size=batch_size,
                                               shuffle=True,
                                               num_workers=1)
    test_dl = torch.utils.data.DataLoader(test_dataset,
                                              batch_size=batch_size,
                                              shuffle=True,
                                              num_workers=1)
    
    for X, y in test_dl:
        print("Shape of X [N, C, H, W]: ", X.shape)
        print("Shape of y: ", y.shape, y.dtype)
        break
    
    import torch.nn.functional as F
    
    class Network_bn(nn.Module):
        def __init__(self):
            super(Network_bn, self).__init__()
            """
            nn.Conv2d()函数:
            第一个参数(in_channels)是输入的channel数量
            第二个参数(out_channels)是输出的channel数量
            第三个参数(kernel_size)是卷积核大小
            第四个参数(stride)是步长,默认为1
            第五个参数(padding)是填充大小,默认为0
            """
            self.conv1 = nn.Conv2d(in_channels=3, out_channels=15, kernel_size=5, stride=1, padding=0)
            self.bn1 = nn.BatchNorm2d(15)
            self.conv2 = nn.Conv2d(in_channels=15, out_channels=15, kernel_size=5, stride=1, padding=0)
            self.bn2 = nn.BatchNorm2d(15)
            self.pool1 = nn.MaxPool2d(2,2)
            
            self.conv3 = nn.Conv2d(in_channels=15, out_channels=30, kernel_size=5, stride=1, padding=0)
            self.bn3 = nn.BatchNorm2d(30)
            self.conv4 = nn.Conv2d(in_channels=30, out_channels=30, kernel_size=5, stride=1, padding=0)
            self.bn4 = nn.BatchNorm2d(30)
            self.pool2 = nn.MaxPool2d(2,2)
    
            self.conv5 = nn.Conv2d(in_channels=30, out_channels=60, kernel_size=5, stride=1, padding=0)
            self.bn5 = nn.BatchNorm2d(60)
            self.conv6 = nn.Conv2d(in_channels=60, out_channels=60, kernel_size=5, stride=1, padding=0)
            self.bn6 = nn.BatchNorm2d(60)
            self.pool3 = nn.MaxPool2d(2,2)
            
            self.fc1 = nn.Linear(60*21*21, len(classeNames))
    
        def forward(self, x):
            x = F.relu(self.bn1(self.conv1(x)))      
            x = F.relu(self.bn2(self.conv2(x)))     
            x = self.pool1(x)                        
            x = F.relu(self.bn3(self.conv3(x)))     
            x = F.relu(self.bn4(self.conv4(x)))  
            x = self.pool2(x)   
            x = F.relu(self.bn5(self.conv5(x)))     
            x = F.relu(self.bn6(self.conv6(x)))  
            x = self.pool3(x)  
            x = x.view(-1, 60*21*21)
            x = self.fc1(x)
    
            return x
    
    device = "cuda" if torch.cuda.is_available() else "cpu"
    print("Using {} device".format(device))
    
    model = Network_bn().to(device)
    
    from torchinfo import summary
    summary(model, (3, 224, 224), batch_dim = 0, col_names = ("input_size", "output_size", "num_params"), verbose = 0)
    
    loss_fn    = nn.CrossEntropyLoss() 
    learn_rate = 1e-3 
    opt        = torch.optim.SGD(model.parameters(),lr=learn_rate)
    
    def train(dataloader, model, loss_fn, optimizer):
        size = len(dataloader.dataset)
        num_batches = len(dataloader)
    
        train_acc, train_loss = 0, 0
        for X, y in dataloader:
            X, y= X.to(device), y.to(device)
    
            pred = model(X)
            loss = loss_fn(pred, y)
    
            # 反向传播
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
    
            # 记录acc与loss
            train_acc += (pred.argmax(1) == y).type(torch.float).sum().item()
            train_loss += loss.item()
    
        train_acc /= size
        train_loss /= num_batches
    
        return train_acc, train_loss
    
    def test (dataloader, model, loss_fn):
        size        = len(dataloader.dataset) 
        num_batches = len(dataloader)      
        test_loss, test_acc = 0, 0
        
        # 当不进行训练时,停止梯度更新,节省计算内存消耗
        with torch.no_grad():
            for imgs, target in dataloader:
                imgs, target = imgs.to(device), target.to(device)
                
                # 计算loss
                target_pred = model(imgs)
                loss        = loss_fn(target_pred, target)
                
                test_loss += loss.item()
                test_acc  += (target_pred.argmax(1) == target).type(torch.float).sum().item()
    
        test_acc  /= size
        test_loss /= num_batches
    
        return test_acc, test_loss
    
    epochs = 20
    train_loss = []
    train_acc = []
    test_acc = []
    test_loss = []
    
    for epoch in range(epochs):
    
        model.train()
        epoch_train_acc, epoch_train_loss = train(train_dl, model, loss_fn, opt)
     
        model.eval()
        epoch_test_acc, epoch_test_loss = test(test_dl, model, loss_fn)
    
        train_acc.append(epoch_train_acc)
        train_loss.append(epoch_train_loss)
        test_acc.append(epoch_test_acc)
        test_loss.append(epoch_test_loss)
    
        template = ('Epoch:{:2d}, Train_acc:{:.1f}%, Train_loss:{:.3f}, Test_acc:{:.1f}%,Test_loss:{:.3f}')
        print(template.format(epoch+1, epoch_train_acc*100, epoch_train_loss, epoch_test_acc*100, epoch_test_loss))
    print('Done')
    
    
    warnings.filterwarnings("ignore")
    plt.rcParams['font.sans-serif'] = ['SimHei']
    plt.rcParams['axes.unicode_minus'] = False
    plt.rcParams['figure.dpi'] = 100
    
    epochs_range = range(epochs)
    
    plt.figure(figsize=(12, 3))
    plt.subplot(1, 2, 1)
    
    plt.plot(epochs_range, train_acc, label='Training Accuracy')
    plt.plot(epochs_range, test_acc, label='Test Accuracy')
    plt.legend(loc='lower right')
    plt.title('Training and Validation Accuracy')
    
    plt.subplot(1, 2, 2)
    plt.plot(epochs_range, train_loss, label='Training Loss')
    plt.plot(epochs_range, test_loss, label='Test Loss')
    plt.legend(loc='upper right')
    plt.title('Training and Validation Loss')
    plt.show()
    
    from PIL import Image
    
    classes = list(total_data.class_to_idx)
    
    def predict_one_image(image_path, model, transform, classes):
    
        test_img = Image.open(image_path).convert('RGB')
        test_img = transform(test_img)
        img = test_img.to(device).unsqueeze(0)
    
        model.eval() 
        output = model(img)
    
        _, pred = torch.max(output, 1) 
        pred_class = classes[pred]
        print(f"预测结果是:{pred_class}")
    
    
    # 预测训练集中的某张照片
    predict_one_image(image_path='./data/Monkeypox/M01_03_00.jpg', 
                      model=model, 
                      transform=train_transforms, 
                      classes=classes)
    
    # 模型保存
    PATH = './model.pth'  # 保存的参数文件名
    torch.save(model.state_dict(), PATH)
    
    # 将参数加载到model当中
    model.load_state_dict(torch.load(PATH, map_location=device))
    
    

    总结:对一些函数还是不太理解需要着重学习一下

  • 25
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 好的,第4关的任务是使用pytorch搭建卷积神经网络来识别手写数字。这个任务需要掌握pytorch的基本操作和卷积神经网络的原理,同时需要对手写数字数据集有一定的了解。通过这个任务,可以深入理解卷积神经网络在图像识别中的应用。 ### 回答2: 随着机器学习和人工智能技术的发展,卷积神经网络成为了图像识别领域的重要工具。PyTorch是流行的深度学习框架之一,可以方便地搭建神经网络模型,特别是卷积神经网络模型。 搭建卷积神经网络识别手写数字的步骤如下: 一、准备数据 我们需要手写数字的数据集,可以使用MNIST数据集,该数据集包括60,000个训练图像和10,000个测试图像。 二、定义模型 我们可以使用PyTorch提供的nn模块定义卷积神经网络模型。其中包括卷积层、池化层和全连接层等,还有激活函数、批量归一化等常见的组件。 三、训练模型 我们需要选择优化算法,例如随机梯度下降(SGD)、Adam等,然后根据训练数据进行训练。这个过程中需要定义损失函数,例如交叉熵损失函数。 四、测试模型 我们可以使用测试数据进行模型测试,计算分类准确率等指标。 代码演示: 以下是一个简单的卷积神经网络的代码示例,用于识别手写数字: ```python import torch import torch.nn as nn import torch.utils.data as Data import torchvision from torchvision import transforms # 定义数据处理方式 transform = transforms.Compose([ transforms.ToTensor(), # 将图片转换为Tensor transforms.Normalize((0.1307,), (0.3081,)) # 标准化 ]) # 准备数据集 train_set = torchvision.datasets.MNIST( root='./data/', train=True, transform=transform, download=True ) train_loader = Data.DataLoader( dataset=train_set, batch_size=64, shuffle=True ) test_set = torchvision.datasets.MNIST( root='./data/', train=False, transform=transform, download=True ) test_loader = Data.DataLoader( dataset=test_set, batch_size=64, shuffle=True ) # 定义卷积神经网络模型 class CNN(nn.Module): def __init__(self): super(CNN, self).__init__() self.conv1 = nn.Conv2d(1, 32, 3, 1, padding=1) self.conv2 = nn.Conv2d(32, 64, 3, 1, padding=1) self.dropout1 = nn.Dropout2d(0.25) self.dropout2 = nn.Dropout2d(0.5) self.fc1 = nn.Linear(64 * 7 * 7, 128) self.fc2 = nn.Linear(128, 10) def forward(self, x): x = self.conv1(x) x = nn.functional.relu(x) x = self.conv2(x) x = nn.functional.relu(x) x = nn.functional.max_pool2d(x, 2) x = self.dropout1(x) x = torch.flatten(x, 1) x = self.fc1(x) x = nn.functional.relu(x) x = self.dropout2(x) x = self.fc2(x) return nn.functional.log_softmax(x, dim=1) # 定义模型和训练参数 model = CNN() optimizer = torch.optim.Adam(model.parameters(), lr=0.01) criterion = nn.CrossEntropyLoss() # 训练模型 for epoch in range(10): model.train() for batch_idx, (data, target) in enumerate(train_loader): optimizer.zero_grad() output = model(data) loss = criterion(output, target) loss.backward() optimizer.step() # 测试模型 model.eval() test_loss = 0 correct = 0 with torch.no_grad(): for data, target in test_loader: output = model(data) test_loss += criterion(output, target).item() pred = output.argmax(dim=1, keepdim=True) correct += pred.eq(target.view_as(pred)).sum().item() test_loss /= len(test_loader.dataset) print('Epoch {} Test set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)'.format( epoch, test_loss, correct, len(test_loader.dataset), 100. * correct / len(test_loader.dataset))) ``` 这段代码定义了一个简单的卷积神经网络模型,包括两个卷积层、两个池化层和两个全连接层。训练10个epoch后,输出测试集的平均损失和分类准确率。 以上便是使用PyTorch搭建卷积神经网络识别手写数字的简要步骤和代码示例。 ### 回答3: 卷积神经网络是一种广泛应用于图像识别和自然语言处理等领域的深度学习模型。而PyTorch是一个非常优秀的深度学习框架,可以方便地实现卷积神经网络。在本题中,我们将使用PyTorch搭建卷积神经网络来识别手写数字。 在使用PyTorch搭建卷积神经网络之前,需要先导入需要的库。这里我们需要导入torch、torchvision和numpy三个库。其中,torch是PyTorch的核心库,torchvision是一些通用的视觉工具集,numpy是Python中处理矩阵和数组的库。导入完成后,我们需要先定义一个卷积神经网络的类,这里我们命名为Net。 Net类中包括了网络的初始化、前向传播、训练和测试四个部分。在初始化中,我们定义了一些卷积层、池化层、全连接层、Dropout层和Batch Normalization层。这些层将构成我们的卷积神经网络。在前向传播中,我们定义了整个网络的逻辑。在训练和测试中,我们使用PyTorch提供的优化器和损失函数来进行训练和测试。 在搭建完卷积神经网络之后,我们需要准备手写数字数据集,并进行数据的预处理。这里我们使用了MNIST数据集,该数据集包含了一些手写数字的图像数据,每个图像对应一个数字标签。我们使用torchvision中的transforms来对数据进行预处理。预处理的步骤包括将图像转换为PyTorch张量、将像素点的值归一化等。最终我们得到了训练集和测试集两个数据集。 接着,我们需要将数据集输入到卷积神经网络中进行训练和测试。在训练过程中,我们按照批次对数据进行处理,然后将处理后的数据输入到网络中进行训练。在每个批次中,我们会计算模型的损失值,并使用PyTorch提供的优化器来更新网络中的参数。训练过程中,我们还会记录下网络的准确率和损失值等指标。在测试过程中,我们只需要将测试集输入到网络中,然后进行预测即可。最终,我们可以通过输出网络的预测结果来测试模型的准确率。 总的来说,使用PyTorch搭建卷积神经网络识别手写数字的过程包括了数据准备、网络搭建、训练和测试四个步骤。通过不断调整网络中的参数和优化策略,我们可以得到一个表现良好的卷积神经网络来进行手写数字的识别任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值