自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 MMagic

MMagic是OpenMMLab生成模型+底层视觉+AIGC多模态算法库。正如其名,来实现一些AI“魔法”。例如文生图,输入文字AI画出相应图片,3D感知,图像去噪,视频超分辨率,黑白照片上色,图像修复填充等等。

2023-06-18 00:10:32 187

原创 底层视觉与MMEditing

对抗生成网络是一种基于神经网络的无监督学习模型,可以建模数据的分布,并通过采样生成新数据。利用多帧进行超分。

2023-06-15 00:17:42 116

原创 MMSegmentation语义分割实战

语义分割的应用非常广泛:无人驾驶、遥感影像、医疗等。

2023-06-14 21:07:32 128

原创 语义分割与MMSegmentation

MMSegmetation是OpenMMLab算法体系中的图像分割算法库,可以用来解决无人驾驶、遥感、医疗等领域的语义分割问题。什么是语义分割?把图像中的每一个像素做分类,即将图像按照物体的类别分割成不同的区域。有多少个像素就分出多少个类别。比如说自动驾驶,我们要分出行人、其他车辆、行车道、人行道、交通标志、房屋、草地、数目等,从而辅助车辆对道路的情况进行识别与认知。还比如视频时替换背景、分析地表农作物的产量、识别脑部肿瘤异物的位置等。按照颜色分割,但是不同物体颜色可能相近,物体内也会包含多种颜色。

2023-06-13 18:10:07 231 1

原创 MMDetection环境配置

目标检测时多任务模型,包括分类和检测。定位物体,还要识别出什么东西。MMDetection支持目标检测、实例分割、全景分割。覆盖广泛。主要特点:模块化设计、支持多种检测任务、速度快、性能高。

2023-06-11 19:51:55 235

原创 目标检测与MMDetection

什么是目标检测?给定一个图片,检测出图片中的物体,用矩形框框出来,识别物体。目标检测VS图像分类都需要深度神经网络实现。但是目标检测物体数量、物体位置、物体大小不固定,而图像分类通常只有一个物体,位于图像中间,占据主要面积。目标检测在人脸识别中,比如拍照时会定位到我们的人脸,摄像头检测违章等。目标检测在自动驾驶中,识别车周围的行人、其他汽车等。目标检测在下游视觉任务中,识别图片中出现的文字,通过文字识别算法,识别出文字。人体姿态估计中,识别出不同的人,再看其姿态。

2023-06-08 15:10:58 102 1

原创 MMPretrain环境配置安装

通过下面的一些命令就可以看到昨天理论课中提到的一些内容,比如经典主干网络的ResNet,多模态算法中BLIP等。安装配置好环境就可以做相应的训练了。

2023-06-07 20:15:30 569 1

原创 安装MMPose&MMDetection教程及出现的一些问题及解决方案

还遇到一个问题就是创建好虚拟环境之后虚拟环境的jupyter notebook会有大大的500 : Internal Server Error错误,打不开jupyter notebook,解决办法就是对比一下跟本地的区别,将没有安装到的包安装一下即可,例如nbconvert等等。从github上下载最新的mmdetection源代码。#从github上下载最新的mmpose源代码。这是本地的包,对比新建的包没有的直接安装即可。如果原来有mmppose文件夹先删除。如果原来有mmppose文件夹先删除。

2023-06-06 21:23:22 1011 1

原创 深度学习预训练与MMPreTrain

MMPreTrain是一个全新升级的预训练开源算法框架,提供各种强大的预训练主干网络,支持了不同的预训练策略。合并了MMClassification和MMSelfSup,有利于用户对不同模型进行筛选。

2023-06-06 18:37:29 233 1

原创 miniconda配置python虚拟环境+pytorch&MMCV依赖安装

今天就来实际操作一下相关的内容,首先环境配置是最基本的。以windows为例。

2023-06-03 22:13:43 978

原创 人体姿态估计MMPose

给出一个特定的图像,例如人脸、手部、身体等,识别出其关键点,可以用坐标的方式表现出来,这是二维层面的,当然也可以三位层面。例如一段滑冰视频、跳操视频、踢球时、拥抱时,预测人体关键点在三维空间中的坐标,在三维空间中还原人的姿态。当然动物的姿态也可以。

2023-06-02 19:12:28 105

原创 初识开源算法体系——OpenMMLab

通过第一节理论课的概述,了解到不少相关的内容,第一次听直播的时候觉得懵懵的,不太听得懂,今天又听了一次回放,清晰了不少,确实,OpenMMLab是一个非常实用的东西,也是现在很多科研或者应用的最佳选择,不论是在我们的日常生活还是公司企业内以及医疗等等各方面都有涉及到,通过概述课了解到很多训练模型,下面简单总结一下。从名字可以看出,是需要到“魔法”的,在人工智能中,AI画画,图像去噪,超分辨率(将模糊的图片变清楚),插帧(将很卡的视频变得流畅),图像填充(还原打马赛克的部分,被涂鸦、消除的部分等)等。

2023-06-01 12:50:35 148 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除