Siraj Raval计算机视觉CV指南

荣•厚德载物

于 2019-08-05 21:15:28 发布

阅读量306

点赞数 1

分类专栏： AI学习记录---DL,CS,CV视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zr940326/article/details/98519749

版权

AI学习记录---DL,CS,CV视觉专栏收录该内容

56 篇文章 2 订阅

订阅专栏

下面是 Siraj Raval，对学习计算机视觉CV的一份建议指南。

详细原地址请看：https://github.com/zr940326/Learn_Computer_Vision

先决条件

学习Python https://www.edx.org/course/introduction-to-python-for-data-science-3
微积分http://tutorial.math.lamar.edu/pdf/Calculus_Cheat_Sheet_All.pdf
线性代数https://www.souravsengupta.com/cds2016/lectures/Savov_Notes.pdf

第1部分：低级视觉

=== 第1周（基本图像处理技术）

亮度（亮度，对比度，伽玛，直方图均衡）
线性滤波（增强图像 - 模糊和锐化，边缘检测，图像计数，卷积）
非线性滤波（中位数，双边滤波器，形态学）
色彩处理（B＆W，饱和度，白平衡）
抖动（量化，有序抖动，Floyd-Steinberg）
混合（图像金字塔）
纹理分析
模板匹配（在图像中查找对象）

视频讲座

https://www.youtube.com/watch?v=-nt80JUNwlw&list=PLjMXczUzEYcHvw5YYSU92WrY8IwhTuq7p&index=2视频1-5

阅读作业

http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf Sec 3.1.1-2,3.2 Sec 3.2.3,4.2 3.3.2-4

项目

通过OpenCV库检测图像中的对象

=== 第2周（运动和光流）

运动分析
光流

视频讲座

阅读作业

http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf Sec 10.5 Sec 8.4（直到8.4.1）

项目

使用OpenCV跟踪视频帧中的移动对象

第2部分：中级视觉（图像>功能）

=== 第3周（基本细分）

分段和聚类算法，如分水岭，抓取
交互式细分
霍夫变换（检测圆，线）
前景提取

视频讲座

阅读作业

Sec Sec 5.2-5.4 http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf

项目

使用OpenCV分割道路图像中的车道线

=== 第4周（Fitting）

拟合线条和曲线
坚固的配件，RANSAC
可变形的轮廓

视频讲座

视频6-7 https://www.youtube.com/watch?v=-nt80JUNwlw&list=PLjMXczUzEYcHvw5YYSU92WrY8IwhTuq7p&index=2

阅读作业

Sec 4.3.2 5.1.1 http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf

项目

使用OpenCV计算走廊图像中的消失点

第3部分：多视图

=== 第5周（多张图片）

局部不变特征检测和描述
图像变换和对齐
平面单应性
对极几何和立体声
对象实例识别

视频讲座

https://www.youtube.com/playlist?list=PLyH-5mHPFffFvCCZcbdWXAb_cTy4ZG3Dj

阅读作业

http://vision.cs.utexas.edu/376-spring2018/#Tues_May_1查看此页面上的相关阅读材料

项目

使用OpenCV将一组图像转换为3D对象

=== 第6周（3D场景）

立体视觉，密集运动和跟踪; 3d对象
3D场景理解
3D分割和建模

视频讲座

阅读作业

谷歌并阅读以下文件

N. Dalal，人体检测的定向梯度直方图
G. Csurka等。（视觉词汇袋 - 跨领域研究的精彩表现）用关键点袋进行视觉分类
S Lazebnik，C Schmid，J Ponce，Beyond of bags of features：用于识别自然场景类别的空间金字塔匹配
Jegou等人。将本地图像描述符聚合为紧凑代码。

项目

使用OpenCV在3D场景中执行对象分割

第4部分：高级视觉（特征>分析）

=== 第7周（物体检测和分类）

对象/场景/活动分类（语义分割）
物体检测（非最大抑制，滑动窗口，边界框和锚点，计数）
YOLO和Darknet，地区提案网络
监督分类算法
序列数据的概率模型
视觉属性
光学字符识别
面部检测

视频讲座

https://www.youtube.com/watch?v=a-v5_8VGV0A&list=PLjMXczUzEYcHvw5YYSU92WrY8IwhTuq7p&index=8 10-18
我在YOLO的视频

阅读作业

http://vision.cs.utexas.edu/376-spring2018/#Tues_May_1查看此页面上的相关阅读材料

项目

使用Tensorflow对图像中的汽车进行分类

=== 第8周（现代深度学习）

主动学习
维度降低
非参数方法和大数据
掌中
转学习
避免过度拟合
甘斯

视频讲座

视频19-20 https://www.youtube.com/watch?v=a-v5_8VGV0A&list=PLjMXczUzEYcHvw5YYSU92WrY8IwhTuq7p&index=8
我关于转学的视频
讲座1-16斯坦福大学https://www.youtube.com/watch?v=vT1JzLTH4G4&list=PL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv

阅读作业

http://vision.cs.utexas.edu/376-spring2018/#Tues_May_1查看此页面上的相关阅读材料

项目

构建生成对抗网络以检测面部

-------------------待完善

荣•厚德载物

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

荣•厚德载物 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。