Kaggle狗的种类识别竞赛——基于Pytorch框架的迁移学习方法

最新推荐文章于 2024-03-31 09:30:35 发布

huahuahuahhhh

最新推荐文章于 2024-03-31 09:30:35 发布

阅读量3k

点赞数 4

分类专栏：深度学习 # 实践项目 # Pytorch 文章标签： Kaggle狗类别识别迁移学习

本文链接：https://blog.csdn.net/Blankit1/article/details/91448275

版权

深度学习同时被 3 个专栏收录

19 篇文章 0 订阅

订阅专栏

Pytorch

14 篇文章 1 订阅

订阅专栏

实践项目

5 篇文章 0 订阅

订阅专栏

本文代码主要参考:
https://www.kaggle.com/blankitdl/using-pytorch-resnet
https://www.kaggle.com/blankitdl/use-pretrained-pytorch-models

Pytorch下的迁移学习

一、基本介绍

比赛题目
Dog Breed Identification
官网对于比赛的介绍

In this playground competition, you are provided a strictly canine subset of ImageNet in order to practice fine-grained image categorization. How well you can tell your Norfolk Terriers from your Norwich Terriers? With 120 breeds of dogs and a limited number training images per class, you might find the problem more, err, ruff than you anticipated.

在这个比赛中，您将获得ImageNet的犬类子集，以便练习细粒度的图像分类。你能把Norwich Terriers和Norfolk Terriers 区别开来吗？有120个品种的狗和数量有限的训练图像，你可能会发现问题比你预期的更多。
数据
查看数据labels.csv是带有标签的训练数据,10.2kx2，sample_submission.csv是测试的数据，10.4k x 121。训练集和测试集几乎是一样的。
在这里插入图片描述

二、代码解析

读取数据信息
查看labels信息。id是图片名称，id.jpg保存在train文件夹下。breed是狗的类别

df_train = pd.read_csv('labels.csv')
submission = pd.read_csv('sample_submission.csv')
df_train.head()

在这里插入图片描述

类别名转成数字标签
df_train.breed.unique()获取df_train这个数据表的breed列中唯一值得个数。
将120种狗的类别对应成数字标签0~119.

class_to_idx = {x:i for i,x in enumerate(df_train.breed.unique())}#类别名转成数字标签
idx_to_class = {i:x for i,x in enumerate(df_train.breed.unique())}#数字标签转成类别名，便于测试时知道输出类别
df_train['target'] =  [class_to_idx[x] for x in df_train.breed]#在原始的表格中添加数字标签列

划分训练集
需要调用sklearn.model_selection的train_test_split.
将练集的一部份划分出来作为验证集的目的是挑选模型，防止模型过拟合。

train,val =train_test_split(df_train,test_size=0.4, random_state=0)#将训练集的一部分划分为测试集

构建数据集

class DogsDataset(Dataset):
    '''
    df: df_train,有id,breed和新增的target信息
    root_dir:图片存放的目录
    transform: 图像处理方法
    '''
    def __init__(self, df, root_dir, transform=None):
        self.df = df
        self.root_dir = root_dir
        self.transform = transform
    
    def __len__(self):
        return len(self.df)#数据量
    
    def __getitem__(self, idx):
        img_name = '{}.jpg'.format(self.df.iloc[idx, 0])#图片名
        fullname = os.path.join(self.root_dir, img_name)#图片路径
        image = Image.open(fullname)#PIL的Image方法
        cls = self.df.iloc[idx,2]#2是target信息
        
        if self.transform:
            image = self.transform(image)
        return [image, cls]#返回PIL对象和数字标签

定义图像处理方法
用到torchvision.transforms库

normalize = transforms.Normalize(
   mean=[0.485, 0.456, 0.406],
   std=[0.229, 0.224, 0.225]
)
ds_trans = transforms.Compose([transforms.Resize(224),
                               transforms.CenterCrop(224),
                               transforms.ToTensor(),
                               normalize])

定义dataloader
用到from torch.utils.data 的DataLoader

BATCH_SIZE = 128
data_dir = '/train/'#注意地址
train_ds = DogsDataset(train, data_dir+'train/', transform=ds_trans)#形成Dataset
val_ds = DogsDataset(val, data_dir+'train/', transform=ds_trans)
train_dl = DataLoader(train_ds, batch_size=BATCH_SIZE, shuffle=True, num_workers=1)#构建Dataloader
val_dl = DataLoader(val_ds, batch_size=4, shuffle=True, num_workers=1)
dataloaders= {'train':train_dl,'val':val_dl}

查看Dataloader是否构建成功

for data in train_dl:
  x,y  = data
  print(x.shape,y.shape)
  print(y)
  break

定义模型
数据集是从Imagnet的一个子集，可以使用在这个数据集上预训练的模型，这里选用的是resnet18,再次基础上微调。
NUM_CLASS狗的种类数，即最后预测结果的维度.
model.fc.in_features是 resnet18最后一层输入神经元的个数
用in_fc_nums和NUM_CLASS作为输入和输出神经元的个数，替换resnet18的全连接层

model = models.resnet18(pretrained=True)
NUM_CLASS = 120#狗的种类数，即最后预测结果的维度
in_fc_nums = model.fc.in_features#resnet18最后一层输入神经元的个数
fc = nn.Linear(in_fc_nums,NUM_CLASS)
model.fc = fc
model = model.cuda()

定义优化器及学习率的调节方法
使用的库分别是torch.optim,torch.nn,torch.optim.lr_scheduler

optimizer = optim.Adam(model.parameters(), lr=0.001, betas=(0.9, 0.999))  # 选用AdamOptimizer
#optimizer = optim.Adam(model.fc.parameters(), lr=0.001, betas=(0.9, 0.999))  # 只优化全连接层
criterion = nn.CrossEntropyLoss()  # 定义损失函数，交叉熵
scheduler = lr_scheduler.StepLR(optimizer, step_size=7, gamma=0.1)

模型训练
模型训练函数有以下几个功能：

训练模型
训练一个epoch后验证，记录训练的训练和验证集的误差及精度
保存在验证集上精度最高的模型
记录每个epoch和整个训练过程的时间

def train_model(model, criterion, optimizer, scheduler, num_epochs=25):
    since = time.time()

    best_model_wts = model.cuda().state_dict()
    best_acc = 0.0

    for epoch in range(num_epochs):
        print('Epoch {}/{}'.format(epoch+1, num_epochs))
        print('-' * 20)

        # Each epoch has a training and validation phase
        for phase in ['train', 'val']:
            since_epoch = time.time()
            if phase == 'train': #训练阶段更新学习率
                scheduler.step()
                model.train(True)  # Set model to training mode
            else:
                model.train(False)  # Set model to evaluate mode

            running_loss = 0.0
            running_corrects = 0

            # Iterate over data.
            for data in dataloaders[phase]:
                # get the inputs
                inputs, labels = data
                inputs = inputs.float().cuda()
                labels = labels.cuda()

                # zero the parameter gradients
                optimizer.zero_grad()
                # forward
                outputs = model(inputs)
                _, preds = torch.max(outputs.data, 1)
#                 print(outputs.data.shape)
#                 print(preds.shape)

                loss = criterion(outputs, labels)

                # backward + optimize only if in training phase
                if phase == 'train':
                    loss.backward()
                    optimizer.step()

                # statistics
                running_loss += loss.item()  # item(),将torch数据转成python数据（数据只有一个元素）
                running_corrects += torch.sum(preds == labels.data)

            if phase == 'train':
                train_epoch_loss = running_loss / len(dataloaders[phase])
                train_epoch_acc = running_corrects / len(dataloaders[phase])
            if phase == 'val':
                val_epoch_loss = running_loss / len(dataloaders[phase])
                val_epoch_acc = running_corrects / len(dataloaders[phase])

            time_elapsed_epoch = time.time() - since_epoch

            # deep copy the model
            if phase == 'val' and val_epoch_acc > best_acc:
                best_acc = val_epoch_acc
                best_model_wts = model.state_dict()
        print('{} Train Loss: {:.4f} Train Acc: {:.4f} Valdation Loss: {:.4f} Valdation Acc: {:.4f} in {:.0f}m {:.0f}s'.format(
                phase, train_epoch_loss, train_epoch_acc, val_epoch_loss, val_epoch_acc, time_elapsed_epoch // 60,time_elapsed_epoch % 60))
        print()

    time_elapsed = time.time() - since
    print('Training complete in {:.0f}m {:.0f}s'.format(
        time_elapsed // 60, time_elapsed % 60))
    print('Best val Acc: {:4f}'.format(best_acc))

    # load best model weights
    model.load_state_dict(best_model_wts)
    return model

调用训练模块，得到最优模型

model = train_model(model, criterion, optimizer, scheduler, num_epochs=25)

验证单张图像

image_path = '/train/train/cb7fb54008ef21a8b55da46d5145acb3.jpg'
img = Image.open(image_path)
img = ds_trans(img)#处理图像
#显示图像
inp = img.numpy().transpose((1, 2, 0))
mean = np.array([0.485, 0.456, 0.406])
std = np.array([0.229, 0.224, 0.225])
inp = std * inp + mean
plt.imshow(inp)

model = model.cpu()
out = model(img)#获得输出
idx = torch.argmax(out).item()
cls = idx_to_class[idx]#获取测试图像类别
print('The breed of testing dog is: ',cls)

huahuahuahhhh

关注

4
点赞
踩
37

收藏

觉得还不错? 一键收藏
3
评论
Kaggle狗的种类识别竞赛——基于Pytorch框架的迁移学习方法

本文代码主要参考:https://www.kaggle.com/blankitdl/using-pytorch-resnet/edithttps://www.kaggle.com/blankitdl/use-pretrained-pytorch-models/edit一、基本介绍比赛题目Dog Breed Identification官网对于比赛的介绍In this playgro...
复制链接

扫一扫