OpenMMLab理论笔记

最新推荐文章于 2024-05-27 15:14:22 发布

cjyysq

最新推荐文章于 2024-05-27 15:14:22 发布

阅读量585

点赞数

文章标签：人工智能

本文链接：https://blog.csdn.net/cjywzj123/article/details/130986781

版权

1. OpenMMlab概述

OpenMMLab诞生于2018年，是一个由中国开发者主导，有国际影响力的人工智能·计算机视觉开源算法体系。

总体框架：2. OpenMMLab各开源算法库详细介绍

2.1 目标检测算法库MMDetaction（https://github.com/open-mmlab/mmdetction）：支持目标检测、实例分割、全景分割。拥有了440+各预训练模型，75+各主流+前沿算法，主流学术数据集。算法丰富涵盖了目标检测、实例分割、全景分割、目标追踪在内几乎所有常用的算法论文及复现（如Fast-RCNN，SSD，YOLOv3等经典以及YOLOX，DETR等前沿）。算法库模型库本身划好了每个CV任务的学习路径和重点，如果想入门哪个领域，可以打开对应算法库看看收录了哪些论文模型。用自己的数据集也可以很轻松的用MMDetection获得不同的目标检测算法在自己数据集的模型跑分，以及修改自己的模型结构。

2.2 目标检测算法库MMYOLO（https://github.com/open-mmlab/mmyolo）：专门用于解决YOLO目标检测问题，收录了各种YOLO版本，复现了各种YOLO论文。可以轻松获得各YOLO版本在数据集上的跑分。

2.3 文字检测识别算法库MMOCR（https://github.com/open-mmlab/mmocr）：文本检测、文本识别、关键信息提取。

MMOCR Kaggle CAPTCHA 验证码文本识别实战项目：

2.4 3D目标检测算法库MMDetection3D（https://github.com/open-mmlab/mmdetction3d）：专门用于3D目标检测任务，在无人驾驶中应用较多。需要激光雷达和毫米波雷达感知无人驾驶汽车周围的3D点云数据来进行目标检测。

2.5 旋转目标检测算法库MMRotate（https://github.com/open-mmlab/mmrotate）：相较于传统目标检测，目标框是带有方向的。

2.6 图像分割算法库 MMSegmentation（https://github.com/open-mmlab/mmsegmentation）：专门做图像分割、语义分割的算法库。多用于医疗影像分析、卫星遥感分析。

2.7 图像分类+预训练+多模态算法库 MMpretraion（https://github.com/open-mmlab/mmpretrain）：可以完成图像分类、图像描述、视觉问答（多模态学习）、视觉定位、检索任务。模型库支持77个算法，共计508个预训练模型，同时提供了详细的文档教程（包括可视化、部署、迁移）。

2.8 姿态估计算法库 MMpose（https://github.com/open-mmlab/mmpose）：

2.9 三维人体姿态估计算法库 MMHuman3D（https://github.com/open-mmlab/mmhuman3d）：

用一个3D数字人拟合人体

2.10 视频动作识别算法库 MMAction2（https://github.com/open-mmlab/mmaction2）：结合视频前后帧、时间序列、上下文信息判定人类动作。支持动作识别、时序检测、时空检测，如手语识别。

2.11 生成模型+底层视觉+AIGC算法库 MMagic（https://github.com/open-mmlab/mmagic）：可实现AI画画、图像去噪、图像插帧、图像去雾、视频超分辨、黑白照片上色等（底层视觉像素操作）。

2.12 模型部署工具箱 MMDeploy（ https://github.com/open-mmlab/mmdeploy）：可以把各模型转换ONNX或TorchScript格式用于终端应用部署推理

2.13 趣味应用游乐园 Playground

3. OpenMMLab开源生态

丰富的生态

cjyysq

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
OpenMMLab理论笔记

2.7 图像分类+预训练+多模态算法库 MMpretraion（https://github.com/open-mmlab/mmpretrain）：可以完成图像分类、图像描述、视觉问答（多模态学习）、视觉定位、检索任务。2.11 生成模型+底层视觉+AIGC算法库 MMagic（https://github.com/open-mmlab/mmagic）：可实现AI画画、图像去噪、图像插帧、图像去雾、视频超分辨、黑白照片上色等（底层视觉像素操作）。支持动作识别、时序检测、时空检测，如手语识别。
复制链接

扫一扫