![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机视觉
文章平均质量分 73
记录学习斯坦福计算机视觉公开课的个人读书笔记
小小小秃头.cheng.qin
求实求真、大气大为
展开
-
斯坦福计算机视觉公开课个人笔记——损失函数与优化
在上一篇文章中,主要介绍了一个线性分类器(图1)。再回顾一下线性分类器的作用,首先从字面意思理解,通过线性二字,可以想到一次函数,我们可以撒上一些点,通过该函数能够将这些点划分到某条线的两侧。再看分类器,那么被线性分类器划分到不同的侧即表示着不同的类。回到上文中小猫图片(后文用image代替)的例子(图2),假如image为2X2,拉长后变为4X1记为x。我们想要进行区别的类为3,那么此时需要一个权重W,该权重为3X4,3则表示需要区分的类别数,4则等于image拉长后的行数。原创 2023-06-27 22:30:35 · 100 阅读 · 1 评论 -
斯坦福计算机视觉公开课个人笔记——神经网络
而神经网络中的神经元如图1(右)所示,在cell body中对传入的加权值求和(sum),当sum大于某个值的时候便发出信号,然后关注发射信号的时间不必要的,仅仅需要关注信息交互的频率,因此使用一个激活函数来对神经元发电频率建模。X为输入,W1为模板 (图3),将X与W1相乘得到h,h为该输入在各个模板的得分。举个例子,输入可能由红色的车,白色的车,但是W1模板中明显看出来是一个红色的车,而后通过W2加权,可能得到一个模板既包含红色的车又包含白色的车,最后组合起来得到都是车这个分类。原创 2023-07-09 00:01:15 · 81 阅读 · 1 评论 -
斯坦福计算机视觉公开课个人笔记——反向传播
回顾一下,当我们输出一张图片进行分类任务的时候,我们回使用到一个SVM分类器,这个分类器就是一个矩阵,这个矩阵的形状为N*M,N表示我们需要需要区分的类别数,M表示图片拉长后的长度。便引入了损失函数,图片经过分类器后会得出各个类别的得分,我们将其他类别的得分分别与正确类别的得分进行减运算,求和,便得到此次分类的损失,正确区分的损失为零。总之,我们可以通过反向传播得到梯度下降的具体的值,之后便可以对权重进行进行更新,不断循环,直到损失收敛。当W与X为向量的时候,便需要使用到雅可比矩阵的知识(待查),如图4。原创 2023-07-05 23:59:25 · 63 阅读 · 0 评论 -
斯坦福计算机视觉公开课个人笔记——卷积神经网络
通常卷积核的大小会用来控制卷积后输出的尺寸,通过下图可以看出,一个7X7的图像经过3X3的卷积核,输出为5X5。提到卷积神经网络,首先需要介绍卷积的原理。下面详细介绍一下卷积核,我们使用一个5X5X3的卷积核在图像上从左至右,从上到下滑动,(图3)这5X5X3的卷积核实际上就是存放权重,在滑动的过程中会不断更新权重,生成某些物体或某些部位的模板,最后通过一个全连接层输出对于各类别的得分。这些卷积核会不断地变多以学习到更多地特征,(图5)形成更准确地模板,前期地卷积核会学习到一些低级特征,比如边缘。原创 2023-07-13 22:27:25 · 98 阅读 · 2 评论 -
斯坦福计算机视觉公开课个人笔记——图像分类
深度学习前戏:最近邻算法、k近邻算法、线性分类器原创 2023-05-23 10:47:30 · 228 阅读 · 2 评论