下面是 Siraj Raval,对学习计算机视觉CV的一份建议指南。
详细原地址请看:https://github.com/zr940326/Learn_Computer_Vision
先决条件
- 学习Python https://www.edx.org/course/introduction-to-python-for-data-science-3
- 微积分http://tutorial.math.lamar.edu/pdf/Calculus_Cheat_Sheet_All.pdf
- 线性代数https://www.souravsengupta.com/cds2016/lectures/Savov_Notes.pdf
第1部分:低级视觉
=== 第1周(基本图像处理技术)
- 亮度(亮度,对比度,伽玛,直方图均衡)
- 线性滤波(增强图像 - 模糊和锐化,边缘检测,图像计数,卷积)
- 非线性滤波(中位数,双边滤波器,形态学)
- 色彩处理(B&W,饱和度,白平衡)
- 抖动(量化,有序抖动,Floyd-Steinberg)
- 混合(图像金字塔)
- 纹理分析
- 模板匹配(在图像中查找对象)
视频讲座
阅读作业
- http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf Sec 3.1.1-2,3.2 Sec 3.2.3,4.2 3.3.2-4
项目
- 通过OpenCV库检测图像中的对象
=== 第2周(运动和光流)
- 运动分析
- 光流
视频讲座
- https://www.udacity.com/course/introduction-to-computer-vision--ud810 Udacity第6课
- https://www.youtube.com/watch?v=-nt80JUNwlw&list=PLjMXczUzEYcHvw5YYSU92WrY8IwhTuq7p&index=2 video 8
- https://www.youtube.com/watch?v=wC8hXuHsHAQ&list=PLvqB6_mDBCdlnT84LK_NvbOqcXLlOTR8j&index=6&t=0s
阅读作业
- http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf Sec 10.5 Sec 8.4(直到8.4.1)
项目
- 使用OpenCV跟踪视频帧中的移动对象
第2部分:中级视觉(图像>功能)
=== 第3周(基本细分)
- 分段和聚类算法,如分水岭,抓取
- 交互式细分
- 霍夫变换(检测圆,线)
- 前景提取
视频讲座
阅读作业
- Sec Sec 5.2-5.4 http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf
项目
- 使用OpenCV分割道路图像中的车道线
=== 第4周(Fitting)
- 拟合线条和曲线
- 坚固的配件,RANSAC
- 可变形的轮廓
视频讲座
阅读作业
- Sec 4.3.2 5.1.1 http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf
项目
- 使用OpenCV计算走廊图像中的消失点
第3部分:多视图
=== 第5周(多张图片)
- 局部不变特征检测和描述
- 图像变换和对齐
- 平面单应性
- 对极几何和立体声
- 对象实例识别
视频讲座
阅读作业
项目
- 使用OpenCV将一组图像转换为3D对象
=== 第6周(3D场景)
- 立体视觉,密集运动和跟踪; 3d对象
- 3D场景理解
- 3D分割和建模
视频讲座
- https://www.youtube.com/watch?v=-nt80JUNwlw&list=PLjMXczUzEYcHvw5YYSU92WrY8IwhTuq7p&index=2 video 9
- 所有视频https://www.coursera.org/learn/stereovision-motion-tracking
阅读作业
谷歌并阅读以下文件
- N. Dalal,人体检测的定向梯度直方图
- G. Csurka等。(视觉词汇袋 - 跨领域研究的精彩表现)用关键点袋进行视觉分类
- S Lazebnik,C Schmid,J Ponce,Beyond of bags of features:用于识别自然场景类别的空间金字塔匹配
- Jegou等人。将本地图像描述符聚合为紧凑代码。
项目
- 使用OpenCV在3D场景中执行对象分割
第4部分:高级视觉(特征>分析)
=== 第7周(物体检测和分类)
- 对象/场景/活动分类(语义分割)
- 物体检测(非最大抑制,滑动窗口,边界框和锚点,计数)
- YOLO和Darknet,地区提案网络
- 监督分类算法
- 序列数据的概率模型
- 视觉属性
- 光学字符识别
- 面部检测
视频讲座
- https://www.youtube.com/watch?v=a-v5_8VGV0A&list=PLjMXczUzEYcHvw5YYSU92WrY8IwhTuq7p&index=8 10-18
- 我在YOLO的视频
阅读作业
项目
- 使用Tensorflow对图像中的汽车进行分类
=== 第8周(现代深度学习)
- 主动学习
- 维度降低
- 非参数方法和大数据
- 掌中
- 转学习
- 避免过度拟合
- 甘斯
视频讲座
- 视频19-20 https://www.youtube.com/watch?v=a-v5_8VGV0A&list=PLjMXczUzEYcHvw5YYSU92WrY8IwhTuq7p&index=8
- 我关于转学的视频
- 讲座1-16斯坦福大学https://www.youtube.com/watch?v=vT1JzLTH4G4&list=PL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv
阅读作业
项目
- 构建生成对抗网络以检测面部
-------------------待完善