飞桨领航团图像分类-课程实践柠檬分类

最新推荐文章于 2024-04-03 13:52:33 发布

不是助词

最新推荐文章于 2024-04-03 13:52:33 发布

阅读量215

点赞数 1

分类专栏： paddle深度学习训练营杂记文章标签：深度学习 paddlepaddle 百度

本文链接：https://blog.csdn.net/weixin_44500061/article/details/114646664

版权

paddle深度学习训练营杂记专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章目录

前言
一、我使用的图像分类开发套件
二、柠檬分类
- 1.主要步骤
- 2.代码示例
总结

前言

本文章主要是参加的百度飞浆图像分类训练营学习心得

一、我使用的图像分类开发套件

飞桨图像分类套件PaddleClas是飞桨为工业界和学术界所准备的一个图像分类任务的工具集，助力使用者训练出更好的视觉模型和应用落地。

二、柠檬分类

1.主要步骤

划分数据集
构建Dataset（数据读取器）
搭建网络-模型封装-定义优化器-模型配置
训练与评估
模型保存

2.代码示例

典型代码如下（示例）：

import paddle
import paddle.nn as nn
from paddle.io import Dataset
import paddle.vision.transforms as T
import paddle.nn.functional as F
from paddle.metric import Accuracy

# 定义数据预处理
data_transforms = T.Compose([
    T.Resize(size=(224, 224)),
    T.RandomHorizontalFlip(224),
    T.RandomVerticalFlip(224),
    T.Transpose(),    # HWC -> CHW
    T.Normalize(
        mean=[0, 0, 0],        # 归一化
        std=[255, 255, 255],
        to_rgb=True)    
])

# 构建Dataset
class MyDataset(paddle.io.Dataset):
    """
    步骤一：继承paddle.io.Dataset类
    """
    def __init__(self, train_img_list, val_img_list,train_label_list,val_label_list, mode='train'):
        """
        步骤二：实现构造函数，定义数据读取方式，划分训练和测试数据集
        """
        super(MyDataset, self).__init__()
        self.img = []
        self.label = []
        # 借助pandas读csv的库
        self.train_images = train_img_list
        self.test_images = val_img_list
        self.train_label = train_label_list
        self.test_label = val_label_list
        if mode == 'train':
            # 读train_images的数据
            for img,la in zip(self.train_images, self.train_label):
                self.img.append('data/data72793/lemon_homework/lemon_lesson/train_images/'+img)
                self.label.append(la)
        else:
            # 读test_images的数据
            for img,la in zip(self.train_images, self.train_label):
                self.img.append('data/data72793/lemon_homework/lemon_lesson/test_images/'+img)
                self.label.append(la)

    def load_img(self, image_path):
        # 实际使用时使用Pillow相关库进行图片读取即可，这里我们对数据先做个模拟
        image = Image.open(image_path).convert('RGB')
        return image

    def __getitem__(self, index):
        """
        步骤三：实现__getitem__方法，定义指定index时如何获取数据，并返回单条数据（训练数据，对应的标签）
        """
        image = self.load_img(self.img[index])
        label = self.label[index]
        # label = paddle.to_tensor(label)
        
        return data_transforms(image), paddle.nn.functional.label_smooth(label)

    def __len__(self):
        """
        步骤四：实现__len__方法，返回数据集总数目
        """
        return len(self.img)

#train_loader
train_dataset = MyDataset(train_img_list=train_image_path_list, val_img_list=val_image_path_list, train_label_list=train_label_list, val_label_list=val_label_list, mode='train')
train_loader = paddle.io.DataLoader(train_dataset, places=paddle.CPUPlace(), batch_size=32, shuffle=True, num_workers=0)

#val_loader

val_dataset = MyDataset(train_img_list=train_image_path_list, val_img_list=val_image_path_list, train_label_list=train_label_list, val_label_list=val_label_list, mode='test')
val_loader = paddle.io.DataLoader(train_dataset, places=paddle.CPUPlace(), batch_size=32, shuffle=True, num_workers=0)

# 模型封装
model_mob = mobilenet_v2(pretrained=True, num_classes=4)
model = paddle.Model(model_mob)

# 定义优化器

# scheduler = paddle.optimizer.lr.LinearWarmup(learning_rate=0.5, warmup_steps=20, start_lr=0, end_lr=0.5, verbose=True)
# optim = paddle.optimizer.SGD(learning_rate=scheduler, parameters=model.parameters())
optim = paddle.optimizer.Adam(learning_rate=0.001, parameters=model.parameters())

# 配置模型
model.prepare(
    optim,
    paddle.nn.CrossEntropyLoss(soft_label=True),
    Accuracy()
    )

# 模型训练与评估
model.fit(train_loader,
        val_loader,
        log_freq=1,
        epochs=10,
        # callbacks=Callbk(write=write, iters=iters),
        verbose=1,
        )

model.save('myresult_mobilev2', False)
model.evaluate(val_loader)

总结

以上是典型的使用基于paddle框架进行的图像分类实际体验，在柠檬测试数据集上通过mobilev2得到了93.6%的准确率。相信再继续炼炼丹，还是比较容易就得到更好的成绩的。

不是助词

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
飞桨领航团图像分类-课程实践柠檬分类

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、PaddleClas是什么？二、柠檬竞赛1.主要步骤2.读入数据总结前言本文章主要是参加的百度飞浆图像分类训练营学习心得一、PaddleClas是什么？飞桨图像分类套件PaddleClas是飞桨为工业界和学术界所准备的一个图像分类任务的工具集，助力使用者训练出更好的视觉模型和应用落地。丰富的模型库：基于ImageNet1k分类数据集，PaddleClas提供了29个系列的分类网络结构和训练配置，133个预训练模
复制链接

扫一扫