计算机视觉,研究如何自动理解图像和视频中的内容。如图像识别、人脸检测、图像生成、风格迁移、视频理解与自动剪辑。
计算机视觉的发展
早期萌芽(1960~1980)
统计机器学习与模式识别(1990~2000)
ImageNet 大型数据库(~2010)
深度学习的时代(2012至今):AlexNet 突破传统视觉系统性能,Fast R-CNN 目标检测走入深度学习时代,深度生成对抗网络实现图像生成。
![](https://i-blog.csdnimg.cn/blog_migrate/88e6c1f727f5fec8f068478ed4178d8a.png)
二、OpenMMLab
1、环境配置https://drnj22rqza.feishu.cn/docx/EdsVdmk9SorUTfxQXYfcobffnrc
2、优点
基于pytorch开发,既可以调用预训练模型,又能解决自己的问题
其模型库和数据集直接可以作为了解该领域的学习路径 ,画好重点;
算法包含最前沿的顶会论文。
![](https://i-blog.csdnimg.cn/blog_migrate/a66f358bfc7c89a10f5de6d1da2ac502.png)
三、机器学习和神经网络
1、机器学习,计算机程序,是从数据中学习经验,以解决特定问题。
2、监督学习(有标签的)、无监督学习(无需数据本身的标注)、强化学习(让智能体自己适应环境)
![](https://i-blog.csdnimg.cn/blog_migrate/c6a11800967677ce09d90e775aea702e.png)