图像分类MMClassification
一、OpenMMLab项目中的重要概念——配置文件
1、深度学习模型的训练涉及几个方面: − 模型结构 模型有几层、每层多少通道数等等 − 数据集 用什么数据训练模型:数据集划分、数据文件路径、数据增强策略等等 − 训练策略 梯度下降算法、学习率参数、batch_size、训练总轮次、学习率变化策略等等 − 运行时 GPU、分布式环境配置等等 − 一些辅助功能 如打印日志、定时保存checkpoint等
2、在 OpenMMLab 项目中,所有这些项目都涵盖在一个配置文件中,一个配置文件定义了一个完整的训练 过程 − model 字段定义模型 − data 字段定义数据 − optimizer、lr_config 等字段定义训练策略 − load_from 字段定义与训练模型的参数文
图像分类模型的构成
配置文件的运作方式
随着深度学习在计算机视觉的广泛应用,以卷积神经网络为代表的深度学习模型取得了突破性的进展。然而,直至今日,尽管提出了以 ViT 为代表的新一代视觉网络架构,但数据问题仍然是构建深度学习模型最常见的挑战之一。在实际的应用场景中,足量且高保真的优质数据集通常是可遇不可求的,一方面费钱费时费力不说,由于隐私保护和极端概率问题,数据集的获取变得尤为困难。因此,一种低成本且有效的方法便是利用数据增强来减少对训练数据的依赖,从而帮助开发人员更好更快地构建高精度的 AI 模型。