OpenMMLab概述
统一的算法框架和生态。
总体框架:
社区生态:
目标检测算法库
MMDetection
- 任务支持:目标检测、实例分割、全景分割
- 覆盖广泛:440+个预训练模型、75+个直流+前沿算法、主流学术数据集
- 算法丰富:两阶段检测器、一阶段检测器、级联检测器、无锚框检测器、Transformer
- 使用方便:训练工具、测试工具、推理API
MMYOLO
覆盖yolov1-yolov8的模型。
文字检测识别算法库
MMOCR
文件检测、文字识别、关键信息提取。
3D目标检测算法库
MMDetection3D
包括7个数据集、40+种算法、130+个预训练模型。
图像分割算法库
MMSegmentation
- 算法丰富:600+个预训练模型、40+篇算法复现
- 模块化设计:配置简便、容易拓展
- 统一超参:大量消融实验、支持公平对比
- 使用方便:训练工具、测试工具、推理API
图像分类+预训练+多模态算法库
MMPretrain
支持图像分类、图像描述、视觉问答、视觉定位、检索任务。算法库支持77个算法,共508个预训练模型。
姿态估计算法库
MMPose
包括人体2D/3D关键点、手部2D/3D关键点、脸部关键点、服装关键点、动物姿态估计。
MMHuman3D
主要用于VR和动作捕捉领域。
视频动作识别算法库
MMAction2
包括行为识别、时序动作检测、时空动作检测。
- 全面支持:动作识别、时序检测、时空检测
- 算法丰富:200+个预训练模型、20+篇论文复现
- 更优更快:训练速度、模型精度
- 使用方便:训练工具、测试工具、推理API、多IO后端支持
生成模型+底层视觉+AIGC算法库
MMagic
包括文本图像生成、图像去噪、图像重建、图像超分辨率、图像去雾、视频超分辨率、视频插帧、图像填充等任务。