mobilenetv2图像分类

Alphapeople

已于 2023-05-21 20:14:38 修改

阅读量265

点赞数

文章标签：分类深度学习计算机视觉

于 2023-05-21 18:53:45 首次发布

本文链接：https://blog.csdn.net/weixin_38241876/article/details/130795164

版权

该代码示例展示了使用PyTorch训练MobilenetV2模型进行图像分类的过程，包括数据预处理、定义数据集、构建模型、设置优化器和学习率调度器，以及保存模型权重。同时，提供了加载模型并进行预测的代码。

摘要由CSDN通过智能技术生成

from torch.utils import data
import os
import cv2
from torchvision import transforms as T
from torchvision.models.mobilenetv2 import mobilenet_v2
from torch.optim.lr_scheduler import StepLR
from torch.nn import CrossEntropyLoss  # SmoothL1Loss
import torch
class datasest(data.Dataset):
    def __init__(self, path):
        self.img_path = []
        self.labels = []
        self.transforms = T.Compose([
            lambda x: cv2.resize(x, (224, 224)),
            T.ToTensor(),
            T.Normalize(mean=[0.5], std=[0.5]),
        ])
        for dir in os.listdir(path):
            for file in os.listdir(os.path.join(path, dir)):
                self.img_path.append(os.path.join(path, dir, file))
                self.labels.append(int(dir))

    def __len__(self):
        return len(self.img_path)

    def __getitem__(self, index):
        img = cv2.imread(self.img_path[index])
        img = self.transforms(img)
        return img, self.labels[index]


train_root = r'D:\test\ceshi\fenlei'
batch_size = 30
lr = 1e-3
weight_decay = 1e-5
lr_step = 10
lr_decay = 0.5  # when val_loss increase, lr = lr*lr_decay
max_epoch = 1000

model = mobilenet_v2(pretrained=False)
traindataset = datasest(train_root)
trainloader = torch.utils.data.DataLoader(traindataset, batch_size=batch_size, shuffle=True, num_workers=0)

criterion = CrossEntropyLoss()  # SmoothL1Loss()

model.cuda()

optimizer = torch.optim.Adam([{'params': model.parameters()}], lr=lr,
                             weight_decay=weight_decay)

scheduler = StepLR(optimizer, step_size=lr_step, gamma=lr_decay)
for epoch in range(max_epoch):
    model.train()
    for batch, (data_input, label) in enumerate(trainloader):
        data_input = data_input.cuda()
        label = label.cuda()
        output = model(data_input)
        loss = criterion(output, label)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        iters = epoch * len(trainloader) + batch
        if iters % 5 == 0:
            print(loss)
    if epoch % 5 == 0:
        torch.save(model.state_dict(), 'net.pth')

预测：

import cv2
from torchvision import transforms as T
from torchvision.models.mobilenetv2 import mobilenet_v2
import torch

transforms = T.Compose([
            T.ToTensor(),
            T.Normalize(mean=[0.5], std=[0.5]),
        ])

model = mobilenet_v2()
model.load_state_dict(torch.load('net.pth'))
model.eval()
img = cv2.imread(r'D:\test\ceshi\fenlei\7\504003322861042723050406261_UP2_15_1254.jpg')
img = cv2.resize(img, (224, 224))
img = transforms(img)
img = torch.reshape(img,(1,3,224,224))
print(img.shape)
print(torch.argmax(model(img)))