pytorch车牌识别

蒟蒻的工具人

已于 2024-05-08 11:55:13 修改

阅读量841

点赞数 7

分类专栏：机器学习文章标签： pytorch 人工智能 python

于 2024-04-10 09:45:12 首次发布

本文链接：https://blog.csdn.net/weixin_51277037/article/details/136530851

版权

使用pytorch库中CNN模型进行图像识别

收集数据集

可以去找开源的数据集或者自己手做一个
最终整合成 类别分类的图片文件
在这里插入图片描述

定义CNN模型

卷积层

功能：提取特征

概念：

卷积层输入层通道数

如果输入数据是彩色图像，那么通常情况下，输入数据具有三个通道（红、绿、蓝），因此第一个卷积层的输入通道数应该为3。
如果输入数据是灰度图像，那么输入通道数通常为 1。

卷积层输出层通道数

卷积层的输出通道数控制着该层提取的特征的数量和复杂度。更多的输出通道意味着网络可以学习更多种类的特征，但过多的输出通道数会导致复杂度和过拟合。

池化层

功能：使卷积层的特征更加明显，对图像进行降维压缩(舍弃无关特征，避免过拟合)，提高神经网络的泛华能力。
问题：

最大池化操作

最大池化操作是一种常用的池化操作，用于减少特征图的空间维度并保留最重要的特征信息

# 定义最大池化层，池化窗口大小为 2x2，步幅为 2
max_pool_layer = nn.MaxPool2d(kernel_size=2, stride=2)

全连接层

将特征进行整合，然后归一化，对各种分类情况都输入一个概率，根据概率进行分类

CNN模型代码

import os
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision.transforms as transforms
from PIL import Image
from torchvision.datasets import ImageFolder
from torch.utils.data import DataLoader, Dataset
# 进度条工具
from tqdm import tqdm

# 数据集中的类别数
num_classes = len(os.listdir('./数据集'))
# 训练的轮数
num_epochs = 10
# 30次：['陕', '陕', 'U', 'U', '6', '6', '6', '6']
# 10次：['陕', 'A', 'D', '0', '6', '6', '6', '6']

# 一、定义数据预处理和数据加载器
transform = transforms.Compose([
    # 固定图像大小
    transforms.Resize((64<