引言:
本博客主要用于记录斯坦福公开课cs231n的学习笔记。
1. 计算机视觉概述:
计算机视觉:针对视觉数据的研究,同时也是一个跨学科的领域,包括生物,物理,数学,工程技术,计算机科学等等课程都与计算机视觉的研究密不可分。
2. 历史背景:
物种大爆炸(Evolution’s Big Bang)爆发的原因:安德鲁.帕克(Andrew Parker)通过对古化石的研究提出5.4亿年前第一次由动物进化出了眼睛,动物们一旦有了视力,变得更加积极。生物为了生存开始了激烈的演化。照相机的由来:最早的照相机可能要追溯到文艺复兴时期的基于小孔成像的相机。哺乳动物的视觉处理机制:视觉处理是基于视觉时间的简单机制,面向边缘,沿着视觉处理途径的移动。信息的变化被人脑复杂的视觉系统识别。
计算机视觉:David Marr 1970的著作对计算机视觉有很大的贡献,他提出视觉的处理需要几个过程-第一个就是原始草图,大部分边缘,曲线用其他元素表示,第二个阶段是2.5维草图,将不连续的深度信息层或视觉场景拼凑起来,之后就是3D维草图。这种思维方式至今已经影响了几十年。80年代 David Lowe通过线和边缘的构建尝试识别剃须刀。
目标分割:将物体特征的像素点分割出来。
面部识别:2006年富士发明了第一部进行实时面部识别的数码相机。