【CS231n Winter 2016 Lecture 1 (Brief history&course overview)】

6 篇文章 0 订阅

lecture 1

这里写图片描述

cs131,计算机视觉本科课程,导论。
cs231a,计算机视觉研究生课程,涵盖CV更加广的知识(cs231n主要是vision recognition/image classification) 有志CV者建议学习
cs231n,主要讲CNN用于image classification

这里写图片描述

历史就不多扯了。。说是几百万年前生物视觉的诞生大幅促进了进化过程,因为捕食者有了眼睛会追,被捕食者有了眼睛会跑blablabla。。。

这里写图片描述

哈佛大学两个人对猫做的实验(nobel prize),意外发现当切换图片时,猫的脑视觉会兴奋,说明V1对边缘和边缘orientation敏感。

这里写图片描述

1963年,Larry Roberts认为边缘才是关键所在,正是边缘(即使颜色或者方位变化)决定了物体的外形。 他的PhD论文正是关于此,是CV的先驱性的文章

这里写图片描述

但是CV的正式诞生应该是在1966年,当时MIT AI lab(1960’s 早期成立的两个AI实验室,一个是Marvin Minsky创立于MIT,另一个是John McCarthy(麦卡锡,同时也是AI一词的发明者)创立于斯坦福)的一个教授觉得应该用一个夏天来解决计算机视觉的问题了。此处被李飞飞吐槽了,想用一个summer project来解决CV的问题。。

2016年是CV的50岁生日了!

这里写图片描述

另一个需要记住的人是David Marr(下图)
Huber&Wiesel(1959, Harvard)告诉我们视觉很简单,就是边缘;
David Marr(1970s)则告诉我们人类的视觉系统应该有不同的stages/layers,最终生成复杂的视觉。

这里写图片描述

David Marr并没有指出类似这种视觉系统的数学模型,但是它的这种stages的思想最终被Deep Learning/CNN所汲取。
此后,循着3D视觉的构造,第一波vision algorithm wave来了。。介绍了几个代表性的工作:

这里写图片描述

Brooks(1979)认为三维的物体都是由简单的物体(比如圆柱体等)组合来的;Fischler(1973)认为。。。那图啥意思?
再下面这个图,飞飞说是当时很有代表性的一个工作,全文都是使用很简单的edges和shapes来识别物体,用来表明之前的CV确实非常原始。

这里写图片描述

此后,90年代终于步入彩色图片时代,当时非常非常有影响力的工作不是 how to recognize an object,而是carve out images into sensible parts(举的例子是比如说人一走进教室,看到的不是一堆像素,而是会在人脑中“分割”出黑板,椅子,人头等等,这些sensible parts)
在CV中也被成为perceptual grouping, 是CV,生物学,AI中很基础的问题,至今仍未很好的解决。

这里写图片描述

下面这个是第一个商用的CV算法real-time face detection,2006年用到了照相机中。

这里写图片描述

人脸检测之后,另一项工作(SIFT),意思是想要recognize an object,不是非得看到全部,一些关键的parts/features足以使得推断整个物体。事实上当今的DL之所以强大也是因为它学到的features和人类专家设计出的features非常相似。所以这个工作不应被遗忘

这里写图片描述

almost last model before DL:Deformable Part Model,通过描述每一部分和部分间的位置关系来表示物体

这里写图片描述

为了领域的发展,需要benchmark, 最知名之一是欧洲的PASCAL VOC

这里写图片描述

但是20类终归太少,于是Imagenet诞生了!

这里写图片描述

从下图可以看到2012年的惊人提升,正是CNN横空出世之时!(纠正一下,CNN上世纪就诞生了,但是并未大红大紫)

这里写图片描述

540million的历史就讲到这里。。下面讲课程大纲

这里写图片描述

cs231n专注于image classification
特别强调了vision recognition并非就是image classification,见下图用语的逻辑,事实上image classification是vision recognition的主要部分,许多vision recognition task都会涉及到,但是除此之外vision recognition还包括了3D modeling,perceptual grouping,segementation…

这里写图片描述
这里写图片描述

CNN has become an important tool for object recognition.
从2012年横空出世,2015年ImageNet的冠军MSRA仍然采用了CNN

这里写图片描述

But, CNN is not invented overnight!
First person who should be remembered is Kunihiko Fukushima who built the neocognitron.
(The neocognitron is a hierarchical, multilayered artificial neural network proposed by Kunihiko Fukushima in the 1980s. It has been used for handwritten character recognition and other pattern recognition tasks, and served as the inspiration for convolutional neural networks. -wiki)

Yann Lecun也是一个很有影响力的科学家,(飞飞说她觉得)他最重要的成果发表于1998年,正值他的导师Hinton发明了反向传播学习算法(如果我没听错的话。。。)他当时工作于Bell lab, which is an amazing place.致力于recognize digits/zip codes

而2012年,在更大的数据驱动以及更强的计算资源的支撑下,Hinton及其学生引领了DL的复兴。

这里写图片描述

最后再强调一下: The quest for visual intelligence goes far beyond object recognition. There are still lots of cool things leaved to be solve..
For examples, (左上角图)dense labeling of entire scene with perceptual grouping…

这里写图片描述

然后,给出下面这幅图是想说,有时候CV不仅仅限于给物体打标签,还会想理解图片中的人在干什么,各个物体之间有什么联系(飞飞表示他们实验室正在做这方面工作)。。

这里写图片描述
这里写图片描述

最后,介绍教师团队!

这里写图片描述

讲到授课理念

这里写图片描述

怎么给成绩,也贴一下。。

这里写图片描述

前修要求:

这里写图片描述

下课咯。。本讲结束!


  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
深度学习-面向视觉识别的卷积神经网络,2016斯坦福大学公开课。课程介绍: 计算机视觉在社会中已经逐渐普及,并广泛运用于搜索检索、图像理解、手机应用、地图导航、医疗制药、无人机和无人驾驶汽车等领域。而这些应用的核心技术就是图像分类、图像定位和图像探测等视觉识别任务。近期神经网络(也就是“深度学习”)方法上的进展极大地提升了这些代表当前发展水平的视觉识别系统的性能。 本课程将深入讲解深度学习框架的细节问题,聚焦面向视觉识别任务(尤其是图像分类任务)的端到端学习模型。在10周的课程中,学生们将会学习如何实现、训练和调试他们自己的神经网络,并建立起对计算机视觉领域的前沿研究方向的细节理解。最终的作业将包括训练一个有几百万参数的卷积神经网络,并将其应用到最大的图像分类数据库(ImageNet)上。我们将会聚焦于教授如何确定图像识别问题,学习算法(比如反向传播算法),对网络的训练和精细调整(fine-tuning)中的工程实践技巧,指导学生动手完成课程作业和最终的课程项目。本课程的大部分背景知识和素材都来源于ImageNet Challenge竞赛。 主讲人: 李飞飞,斯坦福大学计算机科学系副教授。担任斯坦福大学人工智能实验室和视觉实验室主任,主要研究方向为机器学习、计算机视觉、认知计算神经学。她在TED上的演讲,如何教计算机理解图片。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值