OpenMMLab概述

Crazy - ?

已于 2023-06-01 17:57:14 修改

阅读量114

点赞数

文章标签：计算机视觉深度学习人工智能

于 2023-06-01 17:54:35 首次发布

本文链接：https://blog.csdn.net/weixin_46310125/article/details/130993232

版权

OpenMMLab

openmmlab 总体架构概述

在这里插入图片描述

MMDetection：主要用于目标检测、实例分割、全景分割

MMDetection3D：3D目标检测（拥有深度信息的目标检测）

MMPretrain: 图像分类 + 预训练 + 多模态

MMSegmetation：图像分割算法库

MMPose、MMHuman3D：人体分析（关键点检测、三维重建）

MMTracking：目标追踪（视频目标追踪、单目标、多目标）

MMAction2：视频理解（时序理解）

MMOCR：文字识别、文本检测、光学字符识别

MMagic: AIGC算法库

MMEngine：OpenMMLab2发布

MMYOLO：各种YOLO变种

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Crazy - ?

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

AI实战营第一期——浦视开源算法体系OpenMMLab简介

m0_62777538的博客

06-01

457

OpenMMLab诞生于2018年，是由中国开发者主导，具有国际影响力的人工智能计算机视觉开源算法体系，在2022年的世界人工智能大会上，OpenMMLab正式发布2.0版本。OpenMMLab已经累计开源了超过30+个算法库，有2400+个预训练模型（开箱即用），涵盖图像识别分类、目标检测、图像分割、姿态估计、视频理解、OCR光符识别、3D目标检测、3D人体姿态估计、模型轻量化、自监督学习、少样本学习、光流估计，预训练+多模态、AIGC……几乎涵盖各类的计算机视觉任务，可以说是一个非常丰富的工具箱。

【OpenMMLab】OpenMMLab概述

DplusC的博客

06-01

2132

OpenMMLab 诞生于2018年，是一个由中国开发者主导的人工智能计算机视觉开源算法体系。每个计算机视觉任务都有相应的OpenMMLab在Github上开源。OpenMMLab 已经累计开源了超过30个算法库，大量的预训练模型，涵盖了图像识别分类，目标检测，语义分割，姿态估计等等各种计算机视觉任务。而且这些算法库都在Github上免费开源，可以直接下载所有的源代码和预训练文件。

参与评论您还未登录，请先登录后发表或查看评论

上手OpenMMLab——写在最前面：OpenMMLab概述

Yuetian_w的博客

06-01

3312

随着深度学习、计算机视觉等学科的发展，各大研究机构和公司陆续开源自己的深度学习框架，论文发表同时开源代码也成了行业内的习惯。无论身处什么领域，都可以站在OpenMMLab巨人肩膀上，使用开箱即用的模型开发自己的人工智能项目~首推的就是目标检测算法库MMDetection，它可以解决目标检测实例分割全景分割和目标追踪任务这是OpenMMLab在业界最有影响力的算法库，在github上有2万多star~OpenMMLab是开源算法体系，它已经提供了各个计算机视觉方向的大量开箱即用的预训练模型和算法。

【OpenMMLab概述】

weixin_44999445的博客

06-01

317

MMDetection是一个目标检测算法库，他可以解决目标检测，实例分割，全景分割和目标追踪任务，这是OpenMMlab在业界最有影响力的算法库。MMSegmention：语义分割，应用于无人驾驶（马路牙子，交通标志，车道线），遥感图像（河流，山地），医疗领域（肿瘤），对每一个像素进行分类。MMRotate：旋转目标检测，区别于传统的目标检测检测框是垂直的，MMRotate的旋转目标检测检测框有方向。MMPose：姿态估计，关键点检测，用于衡量某个人的动作，高精度多人人体姿态估计，中医穴位辅助定位。

AI 实战训练营（Class 1）OpenMMLab 概述

qq_42866033的博客

06-02

463

OpenMMLab诞生于2018年，是一个由中国开发者主导，有国际影响力的人工智能·计算机视觉开源算法体系。OpenMMLab累计开源超过30个算法库、2400个预训练模型，涵盖图像识别分类、目标检测、图像分割、姿态估计、视频理解、OCR、3D目标检测、3D人体姿态估计、模型轻量化、自监督、少样本、光流、预训练、多模态、AIGC、推理部署等等计算机视觉任务，在Github上累计获得十万颗star，超过了Pytorch。

OpenMMLab-AI实战营第二期——1. 计算机视觉与OpenMMLab概述

啷个哩个啷

06-01

912

个人更关注语义分割和3D方面的内容，所以这里重点记录这两点相关的。

OpenMMlab-相关项目概述（计算机视觉-学习笔记）

weixin_61674495的博客

07-22

1564

OpenMMlab是一个开源项目，主要面对深度学习时代计算机视觉算法的研发，提供一整套算法框架和工具体系。

计算机视觉与openmmlab概述

weixin_42837310的博客

06-09

计算机视觉与openmmlab概述

计算视觉与openMMLab概述

weixin_30581089的博客

06-02

视频动作识别算法库 MMAction2 识别聋哑人的手语翻译，对于动作识别，时序检测以及时空检测。旋转目标检测算法库 MMRotate 传统中的检测没有方向，此方法添加了方向。高精度姿态估计算法 RTMPose 识别动态人体姿态以及对中医穴位的辅助定位。图像分割算法库 MMSegmentation。三维人体姿态估计算法库在虚拟现实技术技术。

Day1：OpenMMlab的概述

qq_64392587的博客

06-01

233

OpenMMlab是一个开源项目，主要面对深度学习时代计算机视觉算法的研发，提供一整套算法框架和工具体系。OpenMMLab。

AI实战营二期 DAY1 openmmlab概述

yqhyqhyqh1的博客

06-02

总体框架代表算法库https://github.com/open-mmlab/mmdetectionGitHub - open-mmlab/mmyolo: OpenMMLab YOLO series toolbox and benchmark. Implemented RTMDet, RTMDet-Rotated,YOLOv5, YOLOv6, YOLOv7, YOLOv8,YOLOX, PPYOLOE, etc.GitHub - open-mmlab/mmocr: OpenMMLab Text Detec

OpenMMLab 训练营第二期笔记二

erhehe2的博客

06-02

272

从给定的图像中识别人脸、手部、身体等关键点。1输入：图像输出：所有关键点的像素坐标 (x1,y1),(x2,y2)…(xJ,yJ), 这 J 为关键点的总数，取决于具体的关键点模型。例如人脸68关键点，手势21关键点，人体18关键点。这是一个很难的模式识别问题，要去追踪这些不断变化的点。

Class 1：OpenMMLab算法开源库概述

weixin_55432951的博客

06-01

252

那这就叫做姿态估计，通过姿态估计，有很多应用场景，比如说手语，以及健身领域。转目标检测框有方向，比如说不同方向的车，不同方向的船，那这是一个比较小。键点检测，比如说把这么一个人各个的关节骨架的点识别出来，然后串成一个火。可以用它来识别医疗影像中的病灶区域，肿瘤的区域，遥感图像中河流。田的面积，街景数据里边的马路牙，交通标志和其他车的位置以及车道线，所。解任务，包括动作识别，时序动作检测，时空动作检测以及基于人体姿态的。专门做图像分割，特别是语义分割的算法库，在街景，在无人。

【计算机方向】三本计算机视觉IEEE系列，发文量高，影响因子呈上升趋势，备受国人追捧！

Kyzy_1919的博客

10-11

1563

该 Transactions 提供了一个国际和跨学科的论坛，以交流知识和数据工程新发展的结果以及这些想法在硬件和软件中的可行性研究。还涵盖了视觉搜索技术、文档和手写分析、医学图像分析、视频和图像序列分析、基于内容的图像和视频检索、面部和手势识别以及相关的专业硬件和/或软件架构等领域。显示-人机交互、视觉信号处理和计算机视觉 （CV）、图像/视频质量评估和体验质量、自发光/非自发光显示器、柔性显示器和电子纸、显示器材料/组件和驱动电子设备、3D 显示和虚拟/增强/混合现实、听觉和触觉显示、计算显示器。

计算机视觉基础

初见月

10-09

657

计算机视觉基础（持续更新）

计算机视觉硬件知识点整理（五）：3CCD彩色相机介绍与成像原理

HanWenKing的博客

10-08

1182

在当代影像技术领域，相机的核心组件——图像传感器，经历了从传统的胶片到现代数字化的革命性转变。其中，3CCD（Three-Chip Charge-Coupled Device）彩色相机作为高端成像设备的代表，以其卓越的色彩还原度和图像质量，长期以来在专业摄影和视频制作领域占据着重要地位。本文旨在深入探讨3CCD彩色相机的成像原理，解析其如何通过独特的色彩分离和处理技术，实现高清晰度、高色彩保真度的影像输出。

机器人研究不同模态之间的融合方法

hallo128的博客

10-11

1200

例如，视觉图像可以帮助机器人定位和识别物体，而触觉数据可以补充视觉的不足，特别是在光线不足或视野受限的情况下。：通常使用时空信息的对齐技术，结合视觉和听觉信号的时序特征，以增强机器人对动态场景的理解。：在机器人导航、物体定位和人机协作任务中，视觉和听觉的融合帮助机器人处理复杂的环境。视觉提供环境和物体的全局信息，而触觉感知物体的局部特征，如材质、温度、摩擦力等。：视觉和触觉的数据通常在空间上不对齐（例如，视觉感知整个场景，而触觉只能感知物体的局部），如何弥合这种差异是研究的重点。

YOLO11震撼发布！

啥都生的博客

09-30

3729

非常高兴地向大家介绍 Ultralytics YOLO系列的新模型： YOLO11！YOLO11 在以往 YOLO 模型基础上带来了一系列强大的功能和优化，使其速度更快、更准确、用途更广泛。主要改进包括。

什么是LTU?