李飞飞计算机视觉-自用笔记(一)
1 课程介绍-计算机视觉概述
互联网上传播的数据绝大多数是视觉数据
1.1 课程介绍-历史背景
计算机视觉简史
David Marr:
1.输入图像
2.原始草图:用其他元素表示边缘、端点、虚拟线条、曲线、边界
3.2.5D草图:将表面、深度信息、视觉场景等不连续的拼凑在一起
4.3D模型的形成
========================================================================
2020.9.2补充
知识包含关系:
发展历程:
========================================================================
图像识别->图像分割->人脸检测->特征检测->目标识别
ImageNet大规模视觉识别竞赛
2012年卷积神经网络脱颖而出
上述技术高速发展的原因
1.计算能力(硬件的发展)
2.数据量与日俱增
基础知识:
Python、C/C++、高等数学、线性代数、计算机图像、机器学习
2 图像分类
图像分类中算法应考虑的因素:相机的位置、光照强度、物体的形变、遮挡情况、背景混乱、类内差异
2.1 数据-驱动方法(机器学习)
- 收集图像和标签的数据集
- 使用机器学习训练分类器
- 用新图像评估分类器
========================================================================
2020.9.3更新
常用数据集:MNIST(10类手写数字);CIFAR10(10类);ImageNet(1000类)
========================================================================