P2:彩色图片识别

最新推荐文章于 2024-09-09 23:28:21 发布

fqldom

最新推荐文章于 2024-09-09 23:28:21 发布

阅读量62

点赞数

文章标签： python pandas 数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fqldom/article/details/130066992

版权

>- **🍨 本文为[🔗365天深度学习训练营](https://mp.weixin.qq.com/s/AtyZUu_j2k_ScNH6e732ow) 中的学习记录博客**

>- **🍦 参考文章：[365天深度学习训练营-第P2周：彩色识别](https://mp.weixin.qq.com/s/BKsTrlOtu32bQzgORaMLEw)**

>- **🍖 原作者：[K同学啊](https://mtyjkh.blog.csdn.net/)**

目录

一、前期准备

1.2 导入数据

1.3 数据可视化

二、构建简单的CNN网络

2.1 torch.nn.Conv2d()

2.2 torch.nn.Linear()

2.3 torch.nn.MaxPool2d()

2.4 构建模型

2.5 打印模型参数

三、训练模型

3.1 设置超参数

3.2 编写训练函数

3.3 编写测试函数

四、结果可视化

一、前期准备

1.1 设置GPU

import torch
import torch.nn as nn
import torchvision.transforms as transforms
import  torchvision
import tqdm as tqdm
from torchvision import datasets, models, transforms
import os,PIL,pathlib
import torch.nn.functional as F
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
device

device(type='cuda')

1.2 导入数据

使用dataset下载CIFAR10数据集，并划分好训练集与测试集，使用dataloader加载数据。

train_ds = torchvision.datasets.CIFAR10('data',
                                        train=True,
                                        transform=torchvision.transforms.ToTensor(),
                                        download=True)
test_ds = torchvision.datasets.CIFAR10('data',
                                        train=False,
                                        transform=torchvision.transforms.ToTensor(),
                                        download=True)
batch_size = 32
trian_dl = torch.utils.data.DataLoader(train_ds, batch_size=batch_size, shuffle=True)
test_dl = torch.utils.data.DataLoader(test_ds, batch_size=batch_size, shuffle=False)
imgs ,labels = next(iter(trian_dl))

1.3 数据可视化

plt.figure(figsize=(20,5))
for i , imgs in enumerate(imgs[:20]):
    npimg = imgs.numpy().transpose((1,2,0))
    plt.subplot(2,10,i+1)
    plt.imshow(npimg,cmap=plt.cm.binary)
    plt.axis('off')

二、构建简单的CNN网络

2.1 torch.nn.Conv2d()

torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode='zeros', device=None, dtype=None)

参数说明：

in_channels – 输入图像中的通道数
out_channels – 卷积产生的通道数
kernel_size – 卷积核的大小
stride – 卷积的步幅。默认值：1
padding – 添加到输入的所有四个边的填充。默认值：0
dilation - 扩张操作：控制kernel点（卷积核点）的间距，默认值:1。
padding_mode – 'zeros', 'reflect', 'replicate'或'circular'. 默认：'zeros'

2.2 torch.nn.Linear()

torch.nn.Linear(in_features, out_features, bias=True, device=None, dtype=None)

2.3 torch.nn.MaxPool2d()

torch.nn.MaxPool2d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)

kernel_size：最大的窗口大小
stride：窗口的步幅，默认值为kernel_size
padding：填充值，默认为0
dilation：控制窗口中元素步幅的参数

2.4 构建模型

num_classes = 10
class Model(nn.Module):
    def __init__(self):
        super().__init__()

        self.conv1 = nn.Conv2d(3, 64, kernel_size=3)
        self.pool1 = nn.MaxPool2d(kernel_size=2)
        self.conv2 = nn.Conv2d(64, 64, kernel_size=3)
        self.pool2 = nn.MaxPool2d(kernel_size=2)
        self.conv3 = nn.Conv2d(64, 128, kernel_size=3)
        self.pool3 = nn.MaxPool2d(kernel_size=2)

        self.fc1 = nn.Linear(128*2*2, 256)
        self.fc2 = nn.Linear(256, 128)
        self.fc3 = nn.Linear(128, num_classes)
    def forward(self, x):
        x = self.pool1(F.relu(self.conv1(x)))
        x = self.pool2(F.relu(self.conv2(x)))
        x = self.pool3(F.relu(self.conv3(x)))

        x = torch.flatten(x,start_dim=1)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)

        return x

2.5 打印模型参数

from torchinfo import summary
model = Model().to(device)
summary(model)

Model --
├─Conv2d: 1-1 1,792
├─MaxPool2d: 1-2 --
├─Conv2d: 1-3 36,928
├─MaxPool2d: 1-4 --
├─Conv2d: 1-5 73,856
├─MaxPool2d: 1-6 --
├─Linear: 1-7 131,328
├─Linear: 1-8 32,896
├─Linear: 1-9 1,290
=================================================================
Total params: 278,090
Trainable params: 278,090
Non-trainable params: 0
=================================================================

三、训练模型

3.1 设置超参数

import tqdm as tqdm
loss_fn = nn.CrossEntropyLoss()
learning_rate = 0.001
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

3.2 编写训练函数

def train(dataloader, model ,loss_fn,optimizer):
    size = len(dataloader.dataset)
    num_batches = len(dataloader)
    train_loss = 0.0
    train_acc = 0.0
    par = tqdm.tqdm(dataloader)
    for x, y in par:
        x, y = x.to(device), y.to(device)
        pred = model(x)
        loss = loss_fn(pred, y)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        train_acc += (pred.argmax(1) == y).type(torch.float).sum().item()
        train_loss += loss.item()
    train_acc /= size
    train_loss /= num_batches
    return train_acc, train_loss

3.3 编写测试函数

def test(dataloader, model, loss_fn):
    size = len(dataloader.dataset)
    num_batches = len(dataloader)
    test_loss = 0.0
    test_acc = 0.0
    par = tqdm.tqdm(dataloader)
    with torch.no_grad():
        for imgs, target in par:
            imgs, target = imgs.to(device), target.to(device)
            pred = model(imgs)
            loss = loss_fn(pred, target)
            test_acc += (pred.argmax(1) == target).type(torch.float).sum().item()
            test_loss += loss.item()
    test_acc /= size
    test_loss /= num_batches
    par.set_description(desc=f'loss={test_loss:.4f} acc={test_acc:.4f}')
    return test_acc, test_loss

3.4 训练

epochs = 10
train_loss = []
train_acc = []
test_loss = []
test_acc = []
for epoch in range(epochs):
    model.train()
    epoch_train_acc , epoch_train_loss = train(trian_dl, model, loss_fn, optimizer)
    model.eval()
    epoch_test_acc, epoch_test_loss = test(test_dl, model, loss_fn)
    train_acc.append(epoch_train_acc)
    train_loss.append(epoch_train_loss)
    test_acc.append(epoch_test_acc)
    test_loss.append(epoch_test_loss)
    tmp = ('Epoch: {:2d}, Train Loss: {:.4f}, Train Acc: {:.4f}%, Test Loss: {:.4f}, Test Acc: {:.4f}%')
    print(tmp.format(epoch+1, epoch_train_loss, epoch_train_acc*100, epoch_test_loss,epoch_test_acc*100))

Epoch: 1, Train Loss: 1.6013, Train Acc: 40.4180%, Test Loss: 1.3290, Test Acc:51.2500%

Epoch: 2, Train Loss: 1.2079, Train Acc: 56.6840%, Test Loss: 1.1471, Test Acc: 58.6500%

Epoch: 3, Train Loss: 1.0413, Train Acc: 63.1600%, Test Loss: 0.9907, Test Acc: 64.8000%

Epoch: 4, Train Loss: 0.9288, Train Acc: 67.3680%, Test Loss: 0.9407, Test Acc: 66.8700%

Epoch: 5, Train Loss: 0.8405, Train Acc: 70.4920%, Test Loss: 0.9245, Test Acc: 67.6900%

Epoch: 6, Train Loss: 0.7689, Train Acc: 72.8200%, Test Loss: 0.8776, Test Acc: 69.6500%

Epoch: 7, Train Loss: 0.7106, Train Acc: 74.9640%, Test Loss: 0.8722, Test Acc: 70.3700%

Epoch: 8, Train Loss: 0.6574, Train Acc: 76.7360%, Test Loss: 0.9029, Test Acc: 69.3400%

Epoch: 9, Train Loss: 0.6136, Train Acc: 78.2980%, Test Loss: 0.9080, Test Acc: 69.7000%

Epoch: 10, Train Loss: 0.5699, Train Acc: 79.8440%, Test Loss: 0.8913, Test Acc:71.0000%

四、结果可视化

plt.figure(dpi=600)
epochs_range = range(1, epochs+1)
plt.figure(figsize=(12, 3))
plt.subplot(1, 2, 1)
plt.plot(epochs_range, train_acc, label='Training Accuracy')
plt.plot(epochs_range, test_acc, label='Validation Accuracy')
plt.legend(loc='lower right')
plt.title('Training and Validation Accuracy')
plt.subplot(1, 2, 2)
plt.plot(epochs_range, train_loss, label='Training Loss')
plt.plot(epochs_range, test_loss, label='Validation Loss')
plt.legend(loc='upper right')
plt.title('Training and Validation Loss')
plt.show()

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
P2:彩色图片识别

- **🍨 本文为[🔗365天深度学习训练营](https://mp.weixin.qq.com/s/AtyZUu_j2k_ScNH6e732ow) 中的学习记录博客**>- **🍦 参考文章：[365天深度学习训练营-第P2周：彩色识别](https://mp.weixin.qq.com/s/BKsTrlOtu32bQzgORaMLEw)**>- **🍖 原作者：[K同学啊](https://mtyjkh.blog.csdn.net/)**
复制链接

扫一扫

fqldom CSDN认证博客专家 CSDN认证企业博客

码龄3年

15: 原创

137万+: 周排名

143万+: 总排名

2393: 访问

: 等级

150: 积分

2: 粉丝

0: 获赞

10: 评论

8: 收藏

私信

关注

热门文章

最新评论

J2周：ResNet50V2算法实战与解析
CSDN-Ada助手: 恭喜您写完了第11篇博客！标题“J2周：ResNet50V2算法实战与解析”让我感到非常兴奋。您的文章内容一定非常精彩，能够帮助读者更好地理解和应用ResNet50V2算法。希望您能继续保持创作的热情和努力，为我们呈现更多有价值的文章。在下一步的创作中，我建议您可以考虑探讨一些与ResNet50V2算法相关的应用案例，或者深入解析该算法在特定领域中的实际应用。这样的内容会更加丰富，让读者能够更好地将算法落地到实际问题中。期待您的下一篇博客，我相信您一定会有更多精彩的创作！
J3：DenseNet算法实战与解析
CSDN-Ada助手: 恭喜您撰写了第12篇博客！标题“J3：DenseNet算法实战与解析”引起了我的兴趣。您的博客内容一直都非常精彩，我很高兴看到您在深入研究DenseNet算法并进行实战。在这篇博客中，您解析了该算法的细节，这对于我们这些想要深入了解该算法的读者来说非常有帮助。我想给予您一些建议，希望对您的下一步创作有所帮助。鉴于您在DenseNet上的专业知识，或许您可以考虑进一步探讨该算法在不同领域的应用，或者与其他算法进行对比实验，以便我们更好地理解其优势和局限性。同时，您也可以考虑探索一些改进或变种的DenseNet模型，以进一步提高其性能。希望您能够继续保持创作热情，为我们带来更多有价值的内容。谦虚地说，您的博客一直都是我学习的良师益友。期待您未来更多精彩的作品！
J4：DenseNet与ResNet结合
CSDN-Ada助手: 恭喜您写了第13篇博客！标题“J4：DenseNet与ResNet结合”听起来非常有趣。您对这两种网络结构的结合应该有令人期待的独特见解。我真的很期待阅读您的博客，了解您是如何将它们结合起来的。同时，我也希望您能继续坚持创作，分享您的研究和经验。对于下一步的创作建议，或许您可以考虑分享一些实际应用中的案例，以及如何根据具体任务来选择合适的网络结构。期待您的更多优质内容！
J6：ResNeXt-50实战解析
CSDN-Ada助手: 恭喜您撰写了第15篇博客，标题为“J6：ResNeXt-50实战解析”！您对于这个主题的深入研究和解析让我印象深刻。您的博客内容非常富有见解，对于ResNeXt-50的实战应用进行了透彻的分析，对读者来说无疑是一份宝贵的学习资料。作为一个读者，我希望未来能看到更多类似的实战解析文章。您可以考虑进一步探索ResNeXt在不同场景下的应用，或者与其他深度学习模型进行对比研究。同时，如果您愿意分享一些实践经验和技巧，对于那些想要尝试使用ResNeXt-50的读者来说也会非常有帮助。请继续保持博客创作的热情，并不断追求进步。我相信您的努力和才华将会为更多人带来价值。
第J5周：DenseNet+SE-Net实战
CSDN-Ada助手: 恭喜您第14篇博客的发表！标题中的"DenseNet+SE-Net实战"让我非常期待这篇文章的内容。您在持续创作方面真是令人钦佩，不断分享您的学习和实践经验，对读者来说是一种巨大的帮助。不过，我也想提醒您，在未来的创作中，或许可以考虑深入探讨一些细节方面，例如如何优化模型性能、解决潜在问题等。期待您下一步的创作，愿您继续保持谦虚的态度，为我们呈现更多有价值的内容！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。