1. OpenMMlab概述
OpenMMLab诞生于2018年,是一个由中国开发者主导,有国际影响力的人工智能·计算机视觉开源算法体系。
总体框架:2. OpenMMLab各开源算法库详细介绍
2.1 目标检测算法库MMDetaction(https://github.com/open-mmlab/mmdetction):支持目标检测、实例分割、全景分割。拥有了440+各预训练模型,75+各主流+前沿算法,主流学术数据集。算法丰富涵盖了目标检测、实例分割、全景分割、目标追踪在内几乎所有常用的算法论文及复现(如Fast-RCNN,SSD,YOLOv3等经典以及YOLOX,DETR等前沿)。算法库模型库本身划好了每个CV任务的学习路径和重点,如果想入门哪个领域,可以打开对应算法库看看收录了哪些论文模型。用自己的数据集也可以很轻松的用MMDetection获得不同的目标检测算法在自己数据集的模型跑分,以及修改自己的模型结构。
2.2 目标检测算法库MMYOLO(https://github.com/open-mmlab/mmyolo):专门用于解决YOLO目标检测问题,收录了各种YOLO版本,复现了各种YOLO论文。可以轻松获得各YOLO版本在数据集上的跑分。
2.3 文字检测识别算法库MMOCR(https://github.com/open-mmlab/mmocr):文本检测、文本识别、关键信息提取。
MMOCR Kaggle CAPTCHA 验证码文本识别实战项目:
2.4 3D目标检测算法库MMDetection3D(https://github.com/open-mmlab/mmdetction3d):专门用于3D目标检测任务,在无人驾驶中应用较多。需要激光雷达和毫米波雷达感知无人驾驶汽车周围的3D点云数据来进行目标检测。
2.5 旋转目标检测算法库MMRotate(https://github.com/open-mmlab/mmrotate):相较于传统目标检测,目标框是带有方向的。
2.6 图像分割算法库 MMSegmentation(https://github.com/open-mmlab/mmsegmentation):专门做图像分割、语义分割的算法库。多用于医疗影像分析、卫星遥感分析。
2.7 图像分类+预训练+多模态算法库 MMpretraion(https://github.com/open-mmlab/mmpretrain):可以完成图像分类、图像描述、视觉问答(多模态学习)、视觉定位、检索任务。模型库支持77个算法,共计508个预训练模型,同时提供了详细的文档教程(包括可视化、部署、迁移)。
2.8 姿态估计算法库 MMpose(https://github.com/open-mmlab/mmpose):
2.9 三维人体姿态估计算法库 MMHuman3D(https://github.com/open-mmlab/mmhuman3d):
用一个3D数字人拟合人体
2.10 视频动作识别算法库 MMAction2(https://github.com/open-mmlab/mmaction2):结合视频前后帧、时间序列、上下文信息判定人类动作。支持动作识别、时序检测、时空检测,如手语识别。
2.11 生成模型+底层视觉+AIGC算法库 MMagic(https://github.com/open-mmlab/mmagic):可实现AI画画、图像去噪、图像插帧、图像去雾、视频超分辨、黑白照片上色等(底层视觉像素操作)。
2.12 模型部署工具箱 MMDeploy( https://github.com/open-mmlab/mmdeploy): 可以把各模型转换ONNX或TorchScript格式用于终端应用部署推理
2.13 趣味应用游乐园 Playground
3. OpenMMLab开源生态
丰富的生态