【OpenMMLab】模型训练常见策略

最新推荐文章于 2023-11-07 20:08:16 发布

guofei_fly

最新推荐文章于 2023-11-07 20:08:16 发布

阅读量677

点赞数

分类专栏： CV 文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guofei_fly/article/details/128887182

版权

CV 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

一、模型训练范式

范式一：监督学习
在有标注的数据上进行模型训练，如VGG、ResNet等网络模型

范式二：自监督学习
通过恰当设计辅助任务,让模型在无标注的数据上进行模型训练，如MAE

当前的深度学习网络架构基本都是基于梯度下降的训练策略，其完整过程流程图为：
在这里插入图片描述

二、调参

参数对于模型的效果至关重要，下图给出了不同网络架构的最优参数配置：
在这里插入图片描述
常见的参数配置和训练策略包括但不限于：

1. 权重初始化策略

1）随机初始化，包括分布采样（如均匀分布或高斯分布）、Xavier方法和Kaiming 方法
2）预训练权重初始化

2. 学习率策略

包括退火策略、warm up策略

3. 优化器策略

包括动量优化器、权重衰减、自适应梯度

4. 权重保存策略

包括早停机制、模型权重平均（EMA）、模型权重平均（SWA）

5. 数据加强策略

在CV领域，常见的数据加强策略包括：几何变换、颜色变换、遮挡、旋转、翻转、图片组合（如mixup、cutmix等）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【OpenMMLab】模型训练常见策略

深度学习模型训练常见策略
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。