目标检测算法库MMDetection,可以解决目标检测实例分割、全景分割和目标追踪任务。这是OpenMMLab在业界最有影响力的算法库。
目标检测算法库MMYOLO,YOLO是经典单目标检测算法,特点是特别快。
文字检测识别算法库MMOCR,文本检测就是把图像上的文本区域抠出来或画出来;文字识别是把文字的内容识别出来;关键信息提取是对一些结构化的票据/证件/拍照进行信息的提取。可以用它来做ai自动给文字区域打马赛克,发票信息提取。也可以用它来解决kaggle上一些文本识别的竞赛和数据集的任务如验证码。
3D目标检测算法MMDetection3D,在无人驾驶中广泛使用,要通过激光雷达和毫米波雷达感知无人驾驶车周围的3d点云数据来进行3d目标检测。
旋转目标检测算法库MMRotate,研究领域较小众。
图像分割算法库MMSegmentation,特别是语义分割,在街景、无人驾驶遥感图像医疗领域很重要,即给每一个像素进行分类,可以用它来识别医疗影像中的病灶区域、机械中寿命预测等。
图像分类+预训练+多模态算法库MMPretrain,可以实现图像分类(分类,取概率最高者)、图像描述(ai文字描述)、视觉问答、视觉定位(识别物体并框选、视觉检索。
姿态估计算法库MMPose,姿态估计即关键点检测(算法很重要),定量衡量人的行为动作,可用于中医穴位辅助定位。
三维人体姿态估计算法MMHuman3D,用3d模型剥落出人体,用3d数字人拟合真人,特别是在动作捕捉领域和vr。
视频动作识别算法库MMAction2,输入一段视频,ai给出视频中的人正在做什么,而这通过单帧画面没法充分反映出来的,需要上下帧和时间序列;这个算法库可以实现动作识别,时序检测,时空检测,可用于手语识别。
生成模型+底层视觉+AIGC算法库MMagic,人工智能生成内容,插帧、去雾、重构图片、超分辨率、黑白老照片的上色、图像填充。