第一天:计算机基础和Openmmlab算法框架
一、计算机视觉基础概念
1. 基本任务
- 分类
- 检测(锚框级别)
- 分割(像素级别)
- 语义分割——只需要分类即可
- 实例分割——除了分大类外,类间个体间也作区分
- 关键点检测
2. 衍生任务
图像:人脸检测,图像迁移,人脸关键点检测,
视频:辅助剪辑,视频理解
3. 历史演进
详见CS231n李飞飞教授的PPT课件
二、OpenMMlab算法框架
算法训练(支持多种任务)和部署(Deploy)一体化的算法框架
- MMDetection:目标检测,实例分割,全景分割(背景也要进行分割)
- MMDetection3D:标注3D框
- MMClassification:图像分类算法库
- MMSegmentation:语义分割:无人驾驶,卫星遥感,医疗影像分析
- MMPose and MMHuman3D:人体姿态
- MMTracking:视频目标追踪,单个目标追踪,多目标追踪
- MMaction2: 视频行为理解:时序动作检测,空间动作检测
- MMOCR:文字识别
- MMEditing:图像恢复,抠图,超分辨率,图像生成
SOTA算法实现覆盖完全,不需要重复造轮子,开箱即用。列举出来的算法都是该任务中的常见算法,可以参照入门。