【学习笔记】cs231n-assignment1-SVM

最新推荐文章于 2024-01-20 22:04:36 发布

KammyIsTheBest

最新推荐文章于 2024-01-20 22:04:36 发布

阅读量607

点赞数

分类专栏： CS231n 文章标签： cs231n

本文链接：https://blog.csdn.net/KammyIsTheBest/article/details/80233434

版权

这篇学习笔记详细介绍了cs231n课程中Assignment1的内容，主要聚焦于SVM（支持向量机）。文章首先指出了kNN算法的局限性，然后进入SVM的学习，包括理解数据含义、计算损失函数梯度dW的正确方法、使用向量方法重写SVM，以及实现随机梯度下降和超参数调优。通过这篇笔记，读者可以深入理解SVM的工作原理及其优化过程。

摘要由CSDN通过智能技术生成

前言

大家好，我是Kay，小白一个。以下是我完成斯坦福 cs231n-assignment1-SVM 这份作业的做题过程、思路、踩到的哪些坑、还有一些得到的启发和心得。希望下面的文字能对所有像我这样的小白有所帮助。

在第一份作业里，我们使用的 kNN 其实有很多缺陷，比如要和全部训练集比较一遍才能得到结果、每张图存的信息太多了内存容易不足等等。现在我们来学习一种更有效率的工具：线性分类器。

线性分类器的思想是，训练集不是拿来比对的，而是拿来对 W 进行训练，使之存下一个所有有同一个标签下的图像的“模板”，等 W 的训练完成后，我们大可抛弃掉整个训练集，用 test 集与这个 W 做比较，显然这种方法高效得多。
一个完整的线性分类器由两部分组成：一个给图片评估分数的函数 + 一个评估与真实标签差距大小的损失函数。
分数函数以 f(x, W) 的形式出现，而损失函数我们将要接触两种处理方法： SVM & Softmax

数据含义分析

· X[N*D]: N 份训练集图像，每份包含的像素数据是 D
· Ｗ[D*C]: D 个像素数据，每个数据对 C 个标签的偏好／倾向

TODO1：计算损失函数里的梯度 dW

        【思路】由于分数函数 f=Wx+b ，所以 W 的梯度为 x，所以直接把 x 的值直接 copy 进 dW 的数组里就行啦。
            dW += -np.reshape(X[i], (-1, 1))

【开始 Debug】结果完全对不上，刚开始以为是这种广播写法不对，用下面的代码去测试了一下，是可行的！不应该对自己的代码没有自信。（虽然这种写法形式很丑）

import numpy as np
a = np.arange(6)
b &#

最低0.47元/天解锁文章

KammyIsTheBest

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【学习笔记】cs231n-assignment1-SVM

前言大家好，我是Kay，小白一个。以下是我完成斯坦福 cs231n-assignment1-SVM 这份作业的做题过程、思路、踩到的哪些坑、还有一些得到的启发和心得。希望下面的文字能对所有像我这样的小白有所帮助。在第一份作业里，我们使用的 kNN 其实有很多缺陷，比如要和全部训练集比较一遍才能得到结果、每张图存的信息太多了内存容易不足等等。现在我们来学习一种...
复制链接

扫一扫