Edgarrrrr-CSDN博客

原创 CS231n（五）Object Detection

在之前我们已经对单纯的图像分类任务进行了简单的介绍。对于一张图片，图像分类实际上是对图片中最主要的物体进行分类。但是在实际应用中一张图片可能会包括多个物体以及信息，这就需要我们对一张照片的不同物体进行分类+定位在图片中的位置。简单而言，目标检测问题就是要去对一张图片中的物体进行那么问题来了我们对目标检测任务该如何去定位+识别呢？这里先给出一个处理的基本思路：Step1：对图像的特征提取依旧和之前一样，比如借助VGG/RESTNET等等。然后进入两个分支。Step2。

2024-03-30 20:51:49 1070 1

原创 CS231n（四）CNN and Its Architectures

至此，CNN包括了卷积层、池化层、全连接层的这种特殊的神经网络，已经大致介绍完了。在作者看来，CNN工作的过程相较于传统的神经网络来说，它更像一个“全局-局部-全局”的过程。它通过卷积层，池化层，一步一步的提取特征信息（特征反映在卷积核中），不断让更多信息集中，让我们关注的信息凸显，最后再进行评分。

2024-03-07 21:03:18 1174 6

原创 CS231n（三）Optimization and Neural Network

利用新的参数继续训练（具体就是前馈通过score function来计算），最终我们的目标是，不断使我们的loss越来越小，从而训练出表现更好的模型！通过此例子可以清晰的看出，在隐藏层之间，我们使用了max（a,b）的操作，i.e.ReLU这个激活函数，这使得原来的线性变换变成非线性的。同理，当我们继续增加隐藏层的数量，且使用更复杂的激活函数，我们可以去模拟任何的连续函数！以分类问题为例子，有时仅仅通过线性分类器是无法达到我们的需求的，我们需要一些非线性的边界约束。这个算法乍一看怪吓人的，其实它很好理解。

2024-02-27 01:21:23 974

原创 CS231n（二）Linear Classifier

首先我们要知道的是，线性分类器也是可以应用于图片分类的一种方法。简单而言，线性分类器的本质是一种参数化方法（parametric approach）。将图片的pixel values 矩阵信息传入分类器中，基于分类器设置的参数矩阵W（可能会包含偏移向量b），通过线性运算，得到对于不同分类类别的评分。我们认为某一个类别标签的评分越高，则待分类的图像属于这个类别的标签的概率越大。所以我们会根据评分选择一个最可能的label，作为我们的预测结果。那么问题来了，参数矩阵W具体是什么呢？

2024-02-22 00:12:46 1020 1

原创 CS231n（一） KNN method in Image classification

—写在之前，究竟什么是图像分类问题？一张图片在计算机视角看来是这样的，具体而言是：计算机能看到它整体的像素宽（pixel wide），像素高（pixel tall），以及每一个像素点的RGB三通道值。我们要做的是将计算机看到的这个三维数组映射到一个我们事先打算分类的标签中。（这里提供一个231n中的例子）这篇blog主要谈谈我对K-nearest neighbor classifier在图像分类任务中的应用。

2024-02-16 10:47:42 1114 4

Project1.exe

2022-12-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人