CS231图像分类笔记

最新推荐文章于 2023-09-20 21:28:26 发布

wssssang

最新推荐文章于 2023-09-20 21:28:26 发布

阅读量83

点赞数

分类专栏： python CS231 文章标签： python 深度学习

本文链接：https://blog.csdn.net/weixin_47798560/article/details/117152670

版权

python 同时被 2 个专栏收录

34 篇文章 5 订阅

订阅专栏

CS231

1 篇文章 0 订阅

订阅专栏

图像分类

在这里插入图片描述

数据驱动方法：给计算机很多数据，然后实现学习算法，让计算机学习到每个类的外形。那么，该方法的第一步就是收集已经做好分类标注的图片来作为训练集。
在这里插入图片描述

Nearest Neighbor分类器

在这里插入图片描述

import numpy as np

class NearestNeighbor(object):
  def __init__(self):
    pass

  def train(self, X, y):
    """ X is N x D where each row is an example. Y is 1-dimension of size N """
    # the nearest neighbor classifier simply remembers all the training data
    self.Xtr = X
    self.ytr = y

  def predict(self, X):
    """ X is N x D where each row is an example we wish to predict label for """
    num_test = X.shape[0]
    # lets make sure that the output type matches the input type
    Ypred = np.zeros(num_test, dtype = self.ytr.dtype)
    # loop over all test rows
    for i in xrange(num_test):
      # find the nearest training image to the i'th test image
      # using the L1 distance (sum of absolute value differences)
      distances = np.sum(np.abs(self.Xtr - X[i,:]), axis = 1)
      min_index = np.argmin(distances) # get the index with smallest distance
      Ypred[i] = self.ytr[min_index] # predict the label of the nearest example

    return Ypred

在这里插入图片描述

k-Nearest Neighbor分类器

使用k-Nearest Neighbor分类器就能做得更好。它的思想很简单：与其只找最相近的那1个图片的标签，我们找最相似的k个图片的标签，然后让他们针对测试图片进行投票，最后把票数最高的标签作为对测试图片的预测。所以当k=1的时候，k-Nearest Neighbor分类器就是Nearest Neighbor分类器。从直观感受上就可以看到，更高的k值可以让分类的效果更平滑，使得分类器对于异常值更有抵抗力。
在这里插入图片描述

用于超参数调优的验证集

在这里插入图片描述
测试数据集只使用一次，即在训练完成后评价最终的模型时使用。
好在我们有不用测试集调优的方法。其思路是：从训练集中取出一部分数据用来调优，我们称之为验证集（validation set）。
把训练集分成训练集和验证集。使用验证集来对所有超参数调优。最后只在测试集上跑一次并报告结果。
交叉验证：有时候，训练集数量较小（因此验证集的数量更小），人们会使用一种被称为交叉验证的方法，这种方法更加复杂些。还是用刚才的例子，如果是交叉验证集，我们就不是取1000个图像，而是将训练集平均分成5份，其中4份用来训练，1份用来验证。然后我们循环着取其中4份来训练，其中1份来验证，最后取所有5次验证结果的平均值作为算法验证结果。
在这里插入图片描述

Nearest Neighbor分类器的优劣

在这里插入图片描述

这里还有个视觉化证据，可以证明使用像素差异来比较图像是不够的。z这是一个叫做t-SNE的可视化技术，它将CIFAR-10中的图片按照二维方式排布，这样能很好展示图片之间的像素差异值。在这张图片中，排列相邻的图片L2距离就小。
在这里插入图片描述
具体说来，这些图片的排布更像是一种颜色分布函数，或者说是基于背景的，而不是图片的语义主体。比如，狗的图片可能和青蛙的图片非常接近，这是因为两张图片都是白色背景。从理想效果上来说，我们肯定是希望同类的图片能够聚集在一起，而不被背景或其他不相关因素干扰。为了达到这个目的，我们不能止步于原始像素比较，得继续前进。

小结

在这里插入图片描述

小结：实际应用k-NN

在这里插入图片描述

wssssang

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CS231图像分类笔记

图像分类数据驱动方法：给计算机很多数据，然后实现学习算法，让计算机学习到每个类的外形。那么，该方法的第一步就是收集已经做好分类标注的图片来作为训练集。Nearest Neighbor分类器import numpy as npclass NearestNeighbor(object): def __init__(self): pass def train(self, X, y): """ X is N x D where each row is an exam
复制链接

扫一扫

专栏目录