斯坦福计算机视觉课程学习总结 -- 1.CV历史简介

最新推荐文章于 2024-06-21 00:39:45 发布

1062

最新推荐文章于 2024-06-21 00:39:45 发布

阅读量926

点赞数 2

分类专栏：计算机视觉机器学习模型文章标签：计算机视觉 CV 课程学习

本文链接：https://blog.csdn.net/liyuan5241/article/details/82290016

版权

机器学习模型同时被 2 个专栏收录

5 篇文章 1 订阅

订阅专栏

计算机视觉

4 篇文章 0 订阅

订阅专栏

自从Google的AlphaGo火遍网络之后，也把人工智能推到了大众眼前，作为一枚普通的攻城狮，随着工作年龄的增加，越来越感觉到技术壁垒对自己职业发展的重要性，没有什么门槛的编程技术+应届生几个月就搞懂的业务知识面前自己哪还有竞争力！另一方面，各行各业都有着自己的鄙视链，程序员也一样，搞业务的有几个自信比搞算法的有前途？这么一看还真得感谢AI在这个时候出现，既没有算法那么枯燥，又因为涉及高数、统计学和编程知识，对入门者有一定的要求，看来看去正好符合我的转型目标，于是从2017年（起步还是晚了…）年中开始，系统的学习了斯坦福机器学习课程、周志华的西瓜书，以及各种博客内容，因工作上没有实际的项目，在kaggle上完成了几个基础的项目，后续的学习中，准备在计算机视觉（CV）领域去寻找机会，考虑到之前笔记本上手写的笔记比较随意而且质量不高，于是有了把课程学习总结写成博客的想法，目前正在学习李飞飞2016年在斯坦福开设的计算机视觉课程，遂以此为博客的起点~

计算机视觉历史简介

之前有学习过CNN，但是从来没有想过为什么最初的卷积层结果是图像的轮廓特征，为什么CNN的结构是这样的，课程里面算是从CV的历史演进角度解答了这两个问题，即目前CV领域的深度学习模型有两个基石：

1. 视觉处理是从简单的形状结构开始

早期，科学家Hubel和Wiesel给猫的基础视觉皮层（处理视觉信号的最前端）插上电极，然后给猫播放（那时候应该还只能手动替换）胶片，胶片内容是鱼、鼠、花等的图片，科学家最初的预期是当猫看到鱼、鼠这种有本能反应的东西时会有信号的激活，然而实验结果让人很沮丧，不同的图片内容面前猫的基础视觉皮层没有反应，反倒是更换胶片的这个行为能检测到激活信号，随着研究的深入，科学家们发现视觉处理前期并不会对图片中整体的鱼或鼠进行处理，而是对简单的形状结构处理，因此在更换胶片时，整个图片的边沿结构变化对基础视觉皮层有激活。这个实例并不是说视觉信号处理不会区分感兴趣和不感兴趣的部分，只是说在视觉处理的前期（视觉处理涉及到很多组织，基础视觉皮层只是紧接着眼睛后的第一个处理器），大脑侧重于处理形状结构。

2. 视觉处理是分层的

科学家David Marr从计算机科学的观点出发，熔数学、心理物理学、神经生理学于一炉，首创人的视觉计算理论，从而使视觉研究的面貌为之一新，视觉处理是分层级的就是他提出。

图像分类(image classification)

图像分类是CV里很重要的一个方向，新学者要区别图像分类和物体检测(object detection)的区别，课程上提到，图像分类关注的是图像整体，而物体检测关注object具体出现在图片中的位置以及objects之间的关系。本课程（斯坦福计算机视觉课程 CS231n）也是聚焦于图像分类。

后续提到了ImageNet数据集和比赛，2012年之前，比赛的冠军方案都是特征处理+SVM分类，2012年CNN模型夺冠并相较之前的模型有了突破性的结果。其次，2012年的CNN相较1998年LeCun在手写识别中使用CNN相比，模型本质没有不同，然而现在的模型使用中，因为有了算例和数据量的飞跃提升，从而使得CNN及其他DL模型再次受到学界和业界的青睐。

1062

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
斯坦福计算机视觉课程学习总结 -- 1.CV历史简介

自从Google的AlphaGo火遍网络之后，也把人工智能推到了大众眼前，作为一枚普通的攻城狮，随着工作年龄的增加，越来越感觉到技术壁垒对自己职业发展的重要性，没有什么门槛的编程技术+应届生几个月就搞懂的业务知识面前自己哪还有竞争力！另一方面，各行各业都有着自己的鄙视链，程序员也一样，搞业务的有几个自信比搞算法的有前途？这么一看还真得感谢AI在这个时候出现，既没有算法那么枯燥，又因为涉及高数、统计...
复制链接

扫一扫

专栏目录