PaddlePaddle2.0 图像分类
本文是「飞桨领航团图像分类速成营」的学习笔记,课程质量很高,有需要的同学可以去看看,课程链接:https://aistudio.baidu.com/aistudio/course/introduce/11939?directly=1&shared=1
课程的安排还是挺紧凑的,文章写的比较仓促,后期有更多经验后一定重新写一篇更好的。
1. 完成图像分类任务的流程
-
数据EDA (Pandas、Matplotlib)
对于图像分类任务,我们通常首先应该统计出每个类别的数量,查看训练集的数据分布情况。通过数据分布情况分析赛题,形成解题思路。(洞察数据的本质很重要。)
-
数据预处理 (OpenCV、PIL、Pandas、Numpy、Scikit-Learn)
-
根据赛题任务定义好读取方法,即Dataset和Dataloader(PaddlePaddle2.0)
-
选择一个图像分类模型进行训练 (PaddlePaddle2.0)
-
对测试集进行测试并提交结果(PaddlePaddle2.0、Pandas)
2. 数据预处理
Compose实现将用于数据集预处理的接口以列表的方式进行组合。
# 定义数