OpenMMLab实战营第二课打卡

本文介绍了图像分类的数学原理和挑战,探讨了卷积神经网络的不同模型如AlexNet、VGG和ResNet,以及解决精度退化的方法。还涉及了神经结构搜索、轻量化模型、VisionTransformers中的注意力机制,同时讨论了学习率、优化器策略和数据增强在模型训练中的重要性。文章总结了深度学习在图像识别领域的进展和关键技术。
摘要由CSDN通过智能技术生成

梳理

  1. 图像分类概述

对图像分类数学原理进行介绍,并讲述了视觉任务的难点,图像分类是让机器从数据中进行学习。

  1. 卷积神经网络

介绍AlexNet、VGG、GoogLeNet、ResNet网络模型,并讲述了精度退化问题。

  1. 更强的图像分类模型

介绍神经结构搜索、ConvNeXt等

  1. 轻量化卷积神经网络

讲述卷积运算基本原理,并对GoogLeNet和ResNet等模型的卷积通道进行了讲解。

  1. Vision Transformers

讲述注意力机制的原理和实现,并介绍了Swin Transformers模型。

  1. 模型学习

对监督学习和自监督学习进行简要介绍。

  1. 监督学习

讲述交叉熵损失、随机梯度下降等知识。

  1. 学习率与优化器策略

将学习率对训练的影响以及其具体策略进行讲解。

  1. 数据增强

对数据增强概念,以及组合数据增强、标签平滑等知识进行详细叙述。

心得

通过本节课知识的学习,了解了深度学习的基本策略,对图像分类的发展以及影响重大的网络模型有了基础的了解,加深了对底层数学原理的理解。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值