这篇博客是为了自己方便回忆知识点做的一些记录和整理,参考资料是知乎专栏的CS231N课程笔记翻译
想看详细版请点链接:
https://zhuanlan.zhihu.com/p/21930884?refer=intelligentunit%20%E8%BF%99%E4%B8%AA%E6%98%AFCS231n%E7%9A%84%E7%BF%BB%E8%AF%91%E7%AC%94%E8%AE%B0
计算机识别图像的困难与挑战
- 视角变化(Viewpoint variation)
- 大小变化(Scale variation)
- 形变(Deformation)
- 遮挡(Occlusion)
- 光照条件(Illumination conditions)
- 背景干扰(Background clutter)
- 类内差异(Intra-class variation)
图像分类流程
输入->学习->评价
从图像到标签分值的参数化映射
该方法的第一部分就是定义一个评分函数,这个函数将图像的像素值映射为各个分类类别的得分,得分高低代表图像属于该类别可能性的高低。
线性分类器
其中W被称为权重(weights),b被称为偏差向量(bias vector)
上面举的例子的分类结果显然不好,分类器输出狗的概率最高,但实际上这是一只猫。
将线性分类器看做模板匹配
关于权重W的另一个解释是它的每一行对应着一个分类的模板。从这个角度看,线性分类器就是再利用学习到的模板针对图像做模板匹配。