CS231n课程笔记：Leture2 Image Classification

最新推荐文章于 2024-08-17 14:10:11 发布

Lyttonkeepgoing

最新推荐文章于 2024-08-17 14:10:11 发布

阅读量417

点赞数

文章标签：深度学习机器学习人工智能

本文链接：https://blog.csdn.net/m0_53292725/article/details/126905407

版权

Memorize all data and labels

def train(images, label):
    return model

Predict the label of the most similar training image

def predict(mdoel, test_images):
    return test_labels

L1 distance:

L2 distance:

codes for Nearest Neighbor classifier

import numpy as np


class NearestNeighbor:
    def __init__(self):
        pass
    def train(self, X, y):
        self.Xtr = X
        self.ytr = y

    def predict(self, x):
        num_test = X.shape[0]
        Ypred = np.zeros(num_test, dtype = self.ytr.dtype)
        for i in xrange(num_test):
            distances = np.sum(np.abs(self.Xtr - X[i, :]), axis = 1)
            min_index = np.argmin(distances)
            Ypred[i] = self.ytr[min_index]

    return Ypred

Q:with N examples how fast are training and prediction

A: Train O(1) predictO(N)(要和数据集中的每一个去比较)

在训练集中选择不同的超参数来训练我们的算法在验证集上进行评估在验证集上表现最好的超参数集

cross validation

KNN的缺点

Very slow at test time

Distance metrics on pixels are not informative

Curse of dimensionality

所以什么是一个比较好测量图像之间距离的方法

Linear Classification

总结我们对训练数据的知识 and stick all that knowledge into W（PARAMENTERS）

然后在测试的时候我们不再需要训练数据只需要这些参数w

如果我们的图像size 是 32*32*3 然后我们把它展开成3072*1的向量如果我们想要得到10*1的class scores 我们就需要乘以10*3072的参数矩阵有时候我们也会加上一个10*1 的bias

举例说明

所以 linear classification 可以看作是 template matching approach 矩阵中的每一行对应图像的某个板块

如果我们用这种方法看待linear classification 我们实际可以获取该权重矩阵的行并将他们分解回图像 and visualize those templates as images

我们现在可以可视化与cifar-10中十个类别中的每一个相对应的学习权重矩阵中的那些行

但是线性分类器只能为每一个类学习一个模板

我们可以把image 看作是高维空间中的一个点然后线性分类器正在放入这些线性决策边界来尝试分类

问题来了

如何选择正确的W 下节讲~

Lyttonkeepgoing

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
CS231n课程笔记：Leture2 Image Classification

如果我们的图像size 是 32*32*3 然后我们把它展开成3072*1的向量如果我们想要得到10*1的class scores 我们就需要乘以10*3072的参数矩阵有时候我们也会加上一个10*1 的bias。我们可以把image 看作是高维空间中的一个点然后线性分类器正在放入这些线性决策边界来尝试分类。在训练集中选择不同的超参数来训练我们的算法在验证集上进行评估在验证集上表现最好的超参数集。我们现在可以可视化与cifar-10中十个类别中的每一个相对应的学习权重矩阵中的那些行。
复制链接

扫一扫