目录
Github八万star,开源计算机视觉神器OpenMMLab_哔哩哔哩_bilibili
1.OpenMMlab概述
开源称为人工智能行业发展的引擎,从统一的深度学习框架theano(2007),Caffe(2013),mxnet,TensorFlow(2015),PaddlePaddle,CNTK(2016),Pytorch,Caffe2(2017),发展到OpenMMlab这样的统一算法框架和生态
openmmlab总体框架
openmmlab现状
2.OpenMMLab 各开源算法库详细介绍
MMDetection
它可以解决目标检测,实例分割,全景分割,目标追踪的任务,优势开箱即用
mmdectection助力科研论文,学术比赛,工业产品落地
MMYOLO
科研专门用来解决YOLO目标检测的问题,收录了各种版本YOLO论文
MMOCR
主要实现文本检测,文本识别,关键信息提取。
MMDetection3D
实现3D目标检测算法库,通过感知3D点云数据来实现3D目标检测
MMRotate
旋转目标检测的算法库,传统目标检测框是横平竖直的但是在旋转目标检测中框是有方向的。
MMSegmentation
是专门做图像分割,特别是语义分割的算法库,在街景,遥感,医疗领域都有许多的应用。
MMPretrain
是图像分类,预训练,多模态的算法库
- 图像分类 ( Image Classification )
- 图像描述 ( Image Caption )
- 视觉问答 ( Visual Question Answering)
- 视觉定位 ( Visual Grounding )
- 检索 ( Retrieval, Image-To-/mage, Text-To-lmage, Image-To-Text )
MMPose
姿态估计算法库 MMPose,实现关节骨架的关键点识别
MMHuman3D
OpenMMLab 三维人体姿态估计算法库 MMHuman3D ,使用3D数字人拟合真人
MMAction2
OpenMMLab 视频动作识别算法库 MMAction2,输入视频给出视频里的人正在做什么
MMagic
OpenMMLab 生成模型+底层视觉+AIGC算法库 MMagic
输入文字实现AI绘画,图像去噪,插帧,超分辨率,图像填充,前景抠出来。
MMDeploy
实现模型终端部署应用的实际场景
硬件
PC、浏览器、手机APP、微信小程序、 服务器、嵌入式开发板
无人车、无人机、Jetson Orin Nano、树莓派、机械臂、物联网设备
芯片
CPU. GPU. TPU. NPU, VPU, DSP. FPGA.
厂商
英特尔、英伟达、AMD、苹果、高通、昇腾、麒麟、瑞芯微…
快速实时、本地终端、硬件多样、算力薄弱、数据隐私
Playground
OpenMMLab 趣味应用游乐场 Playground
3.OpenMMLab 开源生态
覆盖了许多高校和知名企业