CS231n

辣鸭脖

已于 2022-06-15 21:00:22 修改

阅读量94

点赞数

文章标签： python 机器学习开发语言

于 2022-06-14 21:48:34 首次发布

本文链接：https://blog.csdn.net/zhENGHAOSTU/article/details/125205654

版权

深度学习算法大概总结为两个API，一个train函数，一个predict函数。
```
def train(): #Memorize training data
def predict(): #
```
给出两幅图片如何进行比较，其中最简单的一种方法是 $L_1$ 距离，也成为曼哈顿距离。像素之间做差后的绝对值求和。
$L_1 \quad distance: \quad d_1(I_1,I_2)=\sum_p \mid I^p_1-I^p_2 \mid$

这也是K最近邻算法，它的复杂度： $\quad O(1) \quad Predict: \quad O(N)$
另一种方法是 $L_2$ 距离，也称为欧式距离，取像素插值平方和的平方根。
$\quad distance: \quad d_2(I_1,I_2)=\sqrt{\sum_p(I^p_1-I^p_2)^2}$
不同的距离度量，会在你的预测空间里，对底层的几何或拓扑结构做出不同的假设。

$L_2$ 距离和 $L_1$ 距离都不适合用来衡量图像的相似性，因为即使这个图像Boxed或者Shifted，距离还是一样的。

究竟如何区别图像中的不同呢？

权重矩阵的每一行就是对该类的权重值。将图像的pixels矩阵拉为一个列向量。bias也是一个列向量，对每一个类的偏置。
可以将权重矩阵中的每一行理解为对该类的模板，通过这个模板与图像点积计算得到像素值。（也就是说这一行可以再转换为图像）
线性分类器的问题是，每一个类只能学习一个模板.

todo:[07] 3 损失函数和优化介绍，线性分类和k最近邻的作业还没有做

关注