CS231n课程简介
CS231n是Stanford的CV课程,主要专注于解决图像分类问题。网址为 http://vision.stanford.edu/teaching/cs231n/index.html,视频网上有很多。
作者水平不高,这里也仅仅是自己的课程笔记与大家分享,记录一些课程中的重要知识点,欢迎各路大神指教。从作者收到的风评来看,这门课的水准不高,但因为最近要自己设计训练CNN模型,所以听这门课上手。
课程笔记
Introduction大概介绍一下CV包括的领域、CV的历史、以及课程简介,具体参考PPT。
这里记录一些比较有意思的部分:
- 猫的视觉起始于局部简单特征,如不同方向的线。[Hubel & Wiesel, 1959]
- 视觉分析是分层次的。[David Marr, 1970s, Vision]
- SIFT特征以及视觉是极小的简单几何物体的集合[David Lowe, 1987, 1999]
- HoG特征[Dalal & Triggs, 2005]
- 使用CNN数据驱动,学习特征。
自己的思考
这部分内容都是作者自己的想法, 不知真伪。
CNN的感受野就是受1.的启发,而多层网络则是受2.的启发。