ConvNext笔记

在三年之后

已于 2022-09-09 10:35:16 修改

阅读量299

点赞数 1

分类专栏：单目标跟踪文章标签：深度学习 cnn 神经网络

于 2022-06-21 22:35:42 首次发布

本文链接：https://blog.csdn.net/IS_MOKE/article/details/125398137

版权

单目标跟踪专栏收录该内容

32 篇文章 7 订阅

订阅专栏

permute一次操作多个维度
transpose一次操作最多2维度
linespace线性划分
最先进的conv、调参、
cudnn.benchmark=true pytorch将在卷积网络中找都最优算法，去跑

VIT、SwinTrans效果怎么得到的，借鉴transformer的关键点，改造Resnet50（仍然是卷积网络）, 不仅速度快，而且准确率要高

把调参发挥到了极致
保持基本模型不变，增加block神经元的个数、层数，还是认为属于同一个模型T S L

训练技巧：
除了设计模型，训练也对效果有影响、
VIT：AdamW 优化策略和超参数设计
90周期—》300周期
data augmentation:mixup cutmix Rand augment random erasing regularization
76.1%-》78.8% 传统卷积网络和VIT之间的差距可能是来自于训练技巧（优化参数），不一定是模型有问题，然后固定参数，继续做消融实验
在小的数据集上，找到一个最有策略，然后用在大数据集中
紫色是小模型，灰色是大模型

优化器参数
在这里插入图片描述

宏观的设计：
1、resnet50：3 4 6 3 —》3 3 9 3 （仿照1 1 3 1） 78.8% --》79.4%
2、将底层卷积(原来是7x7,stride=2)替换成了4x4 stride=4的卷积，类似于patch（patchify） 79.4—》79.5
3、深度可分离卷积，和self-attention中的加权求和比较相似本来是变差，但把通道数从64–》96
4、瓶颈设计
在这里插入图片描述
FNN先变为4倍大，然后进行压缩为原来的大小