斯坦福计算机视觉课程学习总结 -- 1.CV历史简介

自从Google的AlphaGo火遍网络之后,也把人工智能推到了大众眼前,作为一枚普通的攻城狮,随着工作年龄的增加,越来越感觉到技术壁垒对自己职业发展的重要性,没有什么门槛的编程技术+应届生几个月就搞懂的业务知识面前自己哪还有竞争力!另一方面,各行各业都有着自己的鄙视链,程序员也一样,搞业务的有几个自信比搞算法的有前途?这么一看还真得感谢AI在这个时候出现,既没有算法那么枯燥,又因为涉及高数、统计学和编程知识,对入门者有一定的要求,看来看去正好符合我的转型目标,于是从2017年(起步还是晚了…)年中开始,系统的学习了斯坦福机器学习课程、周志华的西瓜书,以及各种博客内容,因工作上没有实际的项目,在kaggle上完成了几个基础的项目,后续的学习中,准备在计算机视觉(CV)领域去寻找机会,考虑到之前笔记本上手写的笔记比较随意而且质量不高,于是有了把课程学习总结写成博客的想法,目前正在学习李飞飞2016年在斯坦福开设的计算机视觉课程,遂以此为博客的起点~

计算机视觉历史简介

之前有学习过CNN,但是从来没有想过为什么最初的卷积层结果是图像的轮廓特征,为什么CNN的结构是这样的,课程里面算是从CV的历史演进角度解答了这两个问题,即目前CV领域的深度学习模型有两个基石:

1. 视觉处理是从简单的形状结构开始

早期,科学家Hubel和Wiesel给猫的基础视觉皮层(处理视觉信号的最前端)插上电极,然后给猫播放(那时候应该还只能手动替换)胶片,胶片内容是鱼、鼠、花等的图片,科学家最初的预期是当猫看到鱼、鼠这种有本能反应的东西时会有信号的激活,然而实验结果让人很沮丧,不同的图片内容面前猫的基础视觉皮层没有反应,反倒是更换胶片的这个行为能检测到激活信号,随着研究的深入,科学家们发现视觉处理前期并不会对图片中整体的鱼或鼠进行处理,而是对简单的形状结构处理,因此在更换胶片时,整个图片的边沿结构变化对基础视觉皮层有激活。这个实例并不是说视觉信号处理不会区分感兴趣和不感兴趣的部分,只是说在视觉处理的前期(视觉处理涉及到很多组织,基础视觉皮层只是紧接着眼睛后的第一个处理器),大脑侧重于处理形状结构。

2. 视觉处理是分层的

科学家David Marr从计算机科学的观点出发,熔数学、心理物理学、神经生理学于一炉,首创人的视觉计算理论,从而使视觉研究的面貌为之一新,视觉处理是分层级的就是他提出。

图像分类(image classification)

图像分类是CV里很重要的一个方向,新学者要区别图像分类和物体检测(object detection)的区别,课程上提到,图像分类关注的是图像整体,而物体检测关注object具体出现在图片中的位置以及objects之间的关系。本课程(斯坦福计算机视觉课程 CS231n)也是聚焦于图像分类。

后续提到了ImageNet数据集和比赛,2012年之前,比赛的冠军方案都是特征处理+SVM分类,2012年CNN模型夺冠并相较之前的模型有了突破性的结果。其次,2012年的CNN相较1998年LeCun在手写识别中使用CNN相比,模型本质没有不同,然而现在的模型使用中,因为有了算例和数据量的飞跃提升,从而使得CNN及其他DL模型再次受到学界和业界的青睐。

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
├─1.计算机视觉简介、环境准备(python, ipython) │ computer vsion.pdf │ CS231 introduction.pdf │ ├─2.图像分类问题简介、kNN分类器、线性分类器、模型选择 │ 2. 图像分类简介、kNN与线性分类器、模型选择.mp4 │ 2.初识图像分类.pdf │ ├─3.再谈线性分类器 │ 3.再谈线性分类器.mp4 │ 再谈线性分类器.pdf │ ├─4.反向传播算法和神经网络简介 │ .反向传播算法和神经网络简介.pdf │ 4. 反向传播算法和神经网络简介.mp4 │ ├─5.神经网络训练1 │ 5.-神经网络训练1.pdf │ 5.神经网络训练1.mp4 │ ├─6.神经网络训练2、卷积神经网络简介 │ 6.神经网络训练2.mp4 │ 神经网络训练2.pdf │ ├─7.卷积神经网络 │ 7.卷积神经网络.mp4 │ Lession7.pdf │ ├─8.图像OCR技术的回顾、进展及应用前景 │ 8.图像OCR技术的回顾、进展及应用前景.mp4 │ PhotoOCR_xbai.pdf │ └─9.物体定位检测 物体定位检测.pdf │ ├─10.卷积神经网络可视化 │ .卷积神经网络可视化.pdf │ 10.卷积神经网络可视化.mp4 │ ├─11.循环神经网络及其应用 │ 11.循环神经网络及其应用.mp4 │ 循环神经网络.pdf │ ├─12.卷积神经网络实战 │ 12.卷积神经网络训练实战.mp4 │ 卷积神经网络实战.pdf │ ├─13.常见深度学习框架介绍 │ 常见深度学习框架介绍.pdf │ ├─14.图像切割 │ 14.图像切割.mp4
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值