MMLAB学习笔记-DAY2

行吟画者

已于 2023-02-03 23:09:25 修改

阅读量639

点赞数

文章标签：深度学习人工智能计算机视觉

于 2023-02-03 23:04:59 首次发布

本文链接：https://blog.csdn.net/yomik/article/details/128862722

版权

图像分类与基础视觉模型

一、问题描述

图像分类：给定一张图片，识别出图片中物体所属的类别
实现步骤：收集数据->定义模型->训练->预测

二、卷积神经网络

AlexNet
VGG-19
GoogLeNet
残差学习：让新增加的层拟合浅层网络与深层网络之间的差异，更容易学习。梯度可以直接回传到浅层网络监督浅层网络的学习

三、更强的分类模型

神经架构搜索：借助强化学习设计网络结构
Vision Transformers：使用 Transformer 替代卷积网络实现图像分类，使用更大的数据集训练，达到超越卷积网络的精度
ConvNeXt：将 Swin Transformer 的模型元素迁移到卷积网络中

四、轻量化卷积神经网络

降低模型参数量和计算量的方法：降低通道数、减小卷积核的尺寸
GoogLeNet：使用大小不同的卷积核来减小参数量
ResNet：使用1*1卷积降低通道数
可分离卷积：将常规卷积分解为逐层卷积和逐点卷积，降低参数量和计算量

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

行吟画者

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MMLAB学习笔记-DAY2

MMLAB学习笔记-DAY2
复制链接

扫一扫

mmlab-train-test

10-09

在计算机视觉领域，MMDetection是一个广泛使用的开源目标检测框架，由MMCV和MMLAB团队开发。它提供了丰富的模型库，支持多种检测任务，包括单阶段和两阶段检测器。在实际应用中，我们常常需要对模型进行训练和测试，...

Open MMLab Detection Toolbox-python

06-18

它是中大多媒体实验室开发的 OpenMMLab 项目的一部分。主要特点模块化设计我们将检测框架分解为不同的组件，通过组合不同的模块，可以轻松构建定制的对象检测框架。开箱即用支持多种框架工具箱直接支持流行和...

参与评论您还未登录，请先登录后发表或查看评论

MMLab

weixin_46587777的博客

05-03

8003

MMLab MMLab的主要研究方向：机器学习、强化学习、半监督/弱监督/自监督学习等方向的前沿方法和理论长视频理解、3D视觉、生成模型等的计算机视觉新兴方向物体检测、动作识别等核心方向的性能突破 深度学习的创新应用探索，以及与医疗、社会科学、艺术创作等领域的交叉创新 深度学习时代，算法与计算、系统框架、以及计算机体系结构的结合创新 ......

MMLAB库学习

weixin_46779338的博客

02-04

2249

上面展现了模型的结构，主干backbone使用的是ResNet网络，18层，一共4块，输出的是第4个(0,1,2,3)，3对应的是4.style对应的是，我也不太清楚。只知道有pytorch 3*3,和cafe1*1，stride均为2.下面是neck，一般来说，我们对模型进行改进就是对neck进行改进，这里采用的是全局平均池化，后面的是头，由于我们这里是分类故使用全连接做分类。其仅仅写出了一个框架，均为继承关系，因此不会有大片两的代码，共分为4个文件，分别是模型，数据，迭代策略，保存等打印配置。

MMLAB学习笔记-DAY1

yomik的博客

02-02

328

MMLAB训练营学习笔记1-对深度学习的简单认识

MMLAB学习笔记-DAY3

yomik的博客

02-04

140

MMLAB学习笔记-图像分类实战

MMLAB实战系列视频教程

09-13

深度学习时代最完整的计算机视觉开源算法体系！课程大纲；第1章 MMCV安装方法第2章第一模块：分类任务基本操作第3章第一模块：训练结果测试与验证第4章第一模块：模型源码DEBUG演示第5章第二模块：使用...

OpenMMLAB实战系列视频教程

09-13

OpenMMLAB实战系列视频教程是一套专注于深度学习与计算机视觉技术的教程资源，由MMLAB（多媒体计算与学习实验室）提供。这套教程旨在帮助学习者深入理解并掌握OpenMMLAB这一最大最全的开源视觉代码库，涵盖了深度...

MMLAB学习视频和学习代码

12-27

MMLAB是一个专注于图像处理领域的开源框架，提供了丰富的图像处理算法和工具，可以帮助开发者快速开发图像处理应用程序。MMLAB支持多种编程语言，包括C++、Python等，并且提供了多种图像处理工具，如滤波、边缘检测...

Python编程、机器学习与深度学习技术

2301_78164062的博客

07-24

735

Python编程、机器学习与深度学习技术

智能火焰监测系统：基于深度学习的实时火灾预警平台

a871923942的博客

07-24

547

智能火焰监测系统：基于深度学习的实时火灾预警平台

Mindspore框架循环神经网络RNN模型实现情感分类|（五）模型训练

人工智能视觉分析算法学习实践和经验分享。

07-24

188

Mindspore框架循环神经网络RNN模型实现情感分类|（五）模型训练与推理Mindspore框架循环神经网络RNN模型实现情感分类|（六）模型加载和推理（情感分类模型资源下载）

基于深度学习的多智能体系统

weixin_42605076的博客

07-24

949

基于深度学习的多智能体系统（Multi-Agent Systems, MAS）是指通过多个智能体（agents）之间的协作或竞争来完成复杂任务的系统。这些智能体通过深度学习和强化学习技术进行学习和决策，广泛应用于机器人协作、自动驾驶、分布式控制和游戏AI等领域。

卷积神经网络CNN

Life1213的博客

07-24

647

简单来说，就是包含了卷积层的神经网络。

GPU驱动、CUDA 、cuDNN 和CUDA Toolkit之间的关系（深度学习小白必懂）

weixin_44115575的博客

07-23

1112

GPU驱动、CUDA、cuDNN和CUDA Toolkit之间有着紧密的关系，它们共同构成了一个完整的GPU编程和深度学习开发环境。在最初配置anaconda环境时一直搞不明白它们之间的关系。所以根据自己的理解，通俗详细解释它们各自的角色和相互间的关系，并且列举了一些在anaconda虚拟环境中的例子。不对的地方希望大家指正。

深度学习loss

最新发布

weixin_45706801的博客

07-25

803

是 PyTorch 中的一个类，它实现了将 Sigmoid 激活函数和二元交叉熵损失函数合并的功能。这个损失函数接受两个输入：模型的原始输出（未经 Sigmoid 激活）和目标（真实）标签，然后自动计算损失值。由于它在内部集成了 Sigmoid 激活函数，因此可以避免在正向和反向传播过程中可能出现的梯度爆炸或梯度消失问题。是 PyTorch 中一个用于二元分类问题的强大损失函数，它通过结合 Sigmoid 激活函数和二元交叉熵损失函数，提高了训练的效率和数值稳定性。

2.6.AlexNet

shiki217_的博客

07-24

220

本质上是更深更大的LeNet 主要改进：丢弃法、Relu、MaxPooling。

深度学习：目标检测的革命者

2401_85761003的博客

07-23

892

深度学习已经成为目标检测领域的重要驱动力，它通过强大的特征提取能力和端到端的学习方式，极大地提高了检测的准确性和效率。随着技术的不断进步，我们有理由相信深度学习将在目标检测中发挥更大的作用，推动相关行业的快速发展。注意：本文中的代码示例仅供参考，实际使用时请根据你的项目情况进行调整。如果你有任何问题或需要进一步的帮助，请随时联系我们。

OpenMMLab与计算机视觉基础：AI实战营Day1精华

2. 统计学习与模式识别阶段：1990年代至2000年代，EigenFace等人脸识别技术出现，以及VJ人脸检测和Haar特征的提出。 3. ImageNet项目启动：2006年，李飞飞教授的ImageNet数据库为大规模视觉研究提供了基础，推动了...