选用了Stanford University的CS131还有CS231n这两门课程作为素材,很多资料已经可以在这两门课程的网站上找到。
开这个新坑的目的是为了督促自己学习,同时也顺路把自己的研究项目合并到一块。
目录
In cs231
Lecture 2: Image Classification Pipeline 图像识别的流水线
Python Numpy Tutorial
图像识别是计算机视觉中的一项主要任务,想像一下,当我们已经有了一个候选标签池{dog, cat, truck, plane..}时,我们该如何将图片与这些标签池中的标签相对应呢?
这个问题,在计算机的角度看来: 一张图片,如果采用RGB模式编码的话,最终会生成一个大小为 N∗M∗3 的多维矩阵,其中 N 为图片的长度(上至下),
从而我们面临的挑战可以分为以下六类
- 观测点变化
- 光照环境影响
- 形变
- 遮挡物
- 杂乱的背景环境
- 类间变化(多出现于某种族内部的区分)
下面介绍一个简单的图片分类器(Image Classifier)
Nearest Neighbor Classifier
数据集: CIFAR-10
数据集介绍: 这是一个包含10个类标签,5万张训练图片,以及1万张测试图片的数据集,每个图片的大小为32像素*32像素
线性分类器(Linear Classifier)
f(xi,W,b)=Wxi+b
简单地说,这是一