一、计算机视觉基础
1. 定义
计算机视觉是一门让计算机学会“看”的学科, 研究如何自动理解图像和视频中的内容。
2. 任务
计算机视觉任务主要包括图像分类、图像检测和图像分割,其中单目标任务包括图像分类和图像定位,多目标任务包括目标检测和图像分割。
3. 发展
a. 早期萌芽
b. 统计机器学习与模式识别
c. 数据驱动的视觉系统
d. 深度学习时代
e. 大模型时代
4. 应用
计算机视觉的应用包括人脸识别、无人驾驶、风格迁移以及视频理解与自动剪辑等场景。
a. 人脸识别
b. 无人驾驶
c. 风格迁移![在这里插入图片描述](https://img-blog.csdnimg.cn/292d0be5fbda43408986d8b8de848307.png)
d. 视频理解与自动剪辑
二、OpenMMLab入门
1. 总体架构
2. 算法框架
a. 图像分类
b. 图像检测![](https://img-blog.csdnimg.cn/12ca6f436129432abd5b0b50905080f5.png)
c. 图像分割
d. 位姿估计
e. 目标跟踪
f. 行为识别
g. 文字识别
h. 图像编辑
3. 社区生态