图像分类代码模板

TechMasterPlus

已于 2022-10-16 17:03:26 修改

阅读量718

点赞数 5

分类专栏：深度学习 # 图像分类文章标签：分类深度学习人工智能

于 2022-10-03 10:57:01 首次发布

本文链接：https://blog.csdn.net/qq_46644680/article/details/127149532

版权

深度学习同时被 2 个专栏收录

28 篇文章 10 订阅

订阅专栏

图像分类

13 篇文章 4 订阅

订阅专栏

图像分类代码模板

数据集格式和.py格式
如何训练
- 训练步骤
- - 训练自己的数据集
代码各板块解读

github链接：点此进入github项目

数据集格式和.py格式

—dataset
--train
--0
--1.png
--2.png
--3.png
--1
--2
--3
…

–val
--0
--1.png
--2.png
--3.png
--1
--2
--3
…

–train.py
–predict.py

如何训练

训练步骤

训练自己的数据集

1、数据集准备
按上面数据集格式存放自己的数据，将文件夹0，1，2，…的图片换成自己的图片，可以新建多个文件夹
2、开始网络训练
train.py的默认参数可直接训练数据集
3、训练结果预测
改变需要预测的图片的路径，运行predict.py即可输出类别结果

代码各板块解读

train.py

batch_size = 8         #设置批次大小
learning_rate = 1e-4        #设置学习率
epoches = 2                 #设置训练的次数
num_of_classes=10           #要分的类别个数

from tqdm import tqdm
import torch
import os
from torch.utils import data
import torchvision.datasets as dsets
import torchvision.transforms as transforms
trainpath = './dataset/train/'
valpath = './dataset/val/'

#数据增强的方式
traintransform = transforms .Compose([
 transforms .RandomRotation (20),               #随机旋转角度
 transforms .ColorJitter(brightness=0.1),     #颜色亮度
 transforms .Resize([224, 224]),               #设置成224×224大小的张量
 transforms .ToTensor(),                        # 将图⽚数据变为tensor格式
# transforms.Normalize(mean=[0.485, 0.456, 0.406],
# std=[0.229, 0.224, 0.225]),
])


valtransform = transforms .Compose([
 transforms .Resize([224, 224]),
 transforms .ToTensor(), # 将图⽚数据变为tensor格式
])



trainData = dsets.ImageFolder (trainpath, transform =traintransform ) # 读取训练集，标签就是train⽬录下的⽂件夹的名字，图像保存在格⼦标签下的⽂件夹⾥
valData = dsets.ImageFolder (valpath, transform =valtransform )       #读取演正剧
trainLoader = torch.utils.data.DataLoader(dataset=trainData, batch_size=batch_size, shuffle=True)     #将数据集分批次  并打乱顺序
valLoader = torch.utils.data.DataLoader(dataset=valData, batch_size=batch_size, shuffle=False)          #将测试集分批次并打乱顺序

test_sum = sum([len(x) for _, _, x in os.walk(os.path.dirname(trainpath))])        #计算  训练集和测试集的图片总数
train_sum = sum([len(x) for _, _, x in os.walk(os.path.dirname(valpath))])

import numpy as np

import torchvision.models as models
model = models.resnet34(pretrained=True) #pretrained表⽰是否加载已经与训练好的参数
model.fc = torch.nn.Linear(512, num_of_classes) #将最后的fc层的输出改为标签数量（如3）,512取决于原始⽹络fc层的输⼊通道
#model = model.cuda() # 如果有GPU，⽽且确认使⽤则保留；如果没有GPU，请删除

criterion = torch.nn.CrossEntropyLoss() # 定义损失函数

optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate) # 定义优化器

from torch.autograd import Variable
#定义训练的函数
def train(model, optimizer, criterion):
    model.train()
    total_loss = 0
    train_corrects = 0
    for i, (image, label) in enumerate (tqdm(trainLoader)):
         #image = Variable(image.cuda()) # 同理
         #label = Variable(label.cuda()) # 同理
         #print(i,image,label)
         optimizer.zero_grad ()
         target = model(image)
         loss = criterion(target, label)
         loss.backward()
         optimizer.step()
         total_loss += loss.item()
         max_value , max_index = torch.max(target, 1)
         pred_label = max_index.cpu().numpy()
         true_label = label.cpu().numpy()
         train_corrects += np.sum(pred_label == true_label)
    return total_loss / float(len(trainLoader)), train_corrects / train_sum


testLoader=valLoader
#定义测试的函数
def evaluate(model, criterion):
    model.eval()
    corrects = eval_loss = 0
    with torch.no_grad():
        for image, label in tqdm(testLoader):
            #image = Variable(image.cuda()) # 如果不使⽤GPU，删除.cuda()
            #label = Variable(label.cuda()) # 同理
            pred = model(image)
            loss = criterion(pred, label)
            eval_loss += loss.item()
            max_value, max_index = torch.max(pred, 1)
            pred_label = max_index.cpu().numpy()
            true_label = label.cpu().numpy()
            corrects += np.sum(pred_label == true_label)
    return eval_loss / float(len(testLoader)), corrects, corrects / test_sum

#torch.save(model,"./resnet1.pt")

for i in range(epoches):
    print("第{}个epoch".format(i+1))
    train_loss,train_acc=train(model,optimizer,criterion)
    print("train_loss: {}   train_acc: {}\n".format(train_loss,train_acc))
    test_loss,test_correct,test_acc=evaluate(model,criterion)
    print("test_loss: {}    test_correct:{}    test_acc:{}".format(test_loss,test_correct,test_acc))



torch.save(model,"./resnet34_2.pt")#保存模型，第二个参数是保存的路径

predict.py

import torch
import torch.nn as nn
from torchvision import transforms
from PIL import Image

model=torch.load("./resnet34_2.pt")#加载模型
model.eval()
transformer = transforms.Compose([
            transforms.Resize((224,224)),
            transforms.ToTensor(),  # 把PIL核np.array格式的图像转化为Tensor
        ])
#预测图片的路径
filename="./2.png"
img=Image.open(filename)
img=transformer(img)
img= img.unsqueeze(0)
pred=model(img)
#print(pred)
max_value, max_index = torch.max(pred, 1)
print("结果是:"+str(max_index.numpy()[0]))