cs231n笔记1

最新推荐文章于 2019-11-28 16:09:36 发布

Yan_Joy

最新推荐文章于 2019-11-28 16:09:36 发布

阅读量599

点赞数

分类专栏：机器学习文章标签：深度学习机器视觉

本文链接：https://blog.csdn.net/Yan_Joy/article/details/53786602

版权

27 篇文章 0 订阅

订阅专栏

斯坦福深度学习与机器视觉课程cs231n，感觉挺不错的，顺便记下来一些零碎的点，不过具体内容还是要参考笔记、视频。不过网易云课堂的视频还是有些问题的。

研究历史

一开始是对猫的视觉进行研究，发现有如下神奇的特点：

因此研究人员认为神经元对简单形状、边缘有反应。

David Marr提出视觉是分层的。

90年代感知分组，将图像分为不同区域。
1999，SIFT特征，图像识别、匹配。
2001，Face Detection，没有进行3D建模。

数据集：

2011年及之前图像分类识别基本靠SIFT+SVM。
其竞赛2012年出现CNN，AlexNet，7层layer夺得冠军。
之后2014：GoogleNet，VGG；2015：MSRA深度残差，均基于CNN。

两图像距离的定义。

超参数：无法在训练中优化，如距离定义、k值。
采用单一验证、交叉验证方法。

kNN流程：

公式：
SVM
$j\neq y_i$ 是指对于第 $i$ 类，只对其他类进行求和运算；
$s_j$ 是第j类得分结果；
$s_{y_i}$ 是本类的得分结果；
$\Delta$ 是常数，一般取1。
这是某一类的损失，总损失可以求平均。

image	cat score	car score	frog score	losses
CAT	3.2	5.1	-1.7	2.9
CAR	1.3	4.9	2.0	0
FROG	2.2	2.5	-3.1	10.9

regularization
正则化项避免过拟合，考虑更多输入。

loss

公式：
softmax
softmaxwithloss
计算过程：

$L_{cat}=-log(0.13)=0.89$
当初始时（w很小），L=-log(1/N)=log(N)。

CS231n Convolutional Neural Networks for Visual Recognition
CS231n官方笔记授权翻译总集篇发布
 斯坦福CS231n—深度学习与计算机视觉

关注

专栏目录