OpenMMLab00-理论课概述
人工智能行业发展:统一的深度学习框架 → \rightarrow →统一的算法框架和生态
OpenMMLab代表算法库
MMDetection:目标检测、实例分割、全景分割、目标追踪
MMYOLO:目标检测、实例分割
MMOCR:文字检测识别算法库,包括文本检测、文本识别、关键信息提取
MMDetection3D:3D目标检测算法库,通过激光雷达和毫米波雷达感知周围3D点云数据
MMRotate:旋转目标检测算法库,框有方向
MMSegmentation:图像分割算法库,主要是语义分割,应用于无人驾驶、卫星遥感、医疗影像等
MMPretrain:图像分类+预训练+多模态算法库,包括图像分类(Image Classification)、图像描述(Image Caption)、视觉问答(Visual Question Answering)、视觉定位(Visual Grounding)、检索(Retrieval,Image-to-Image,Text-to-Image,Image-to-Text)
MMPose:姿态估计算法库,也就是关键点检测
MMHuman3D:三维人体姿态估计算法库,用3D模型包络人体,应用于动作捕捉、虚拟现实
MMAction2:视频动作识别算法库,结合时间序列上下文的信息进行识别,包括动作识别、时序检测、时空检测
MMagic:生成模型+底层视觉+AIGC算法库
MMDeploy:人工智能模型部署应用场景需要快速实时、本地终端、硬件多样、算力薄弱、数据隐私
Playground:SAM
MMTracking:目标追踪