CS231n 卷积神经网络与计算机视觉 3 最优化与随机梯度下降

bea_tree

于 2016-05-25 17:21:25 发布

阅读量4.1k

点赞数 2

分类专栏：卷积神经网络CS231n笔记文章标签： sgd 随机梯度下降 CNN 计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bea_tree/article/details/51496484

版权

上节中我们已经接触到了图像识别中的两部分score function和 loss function，这节将会引入对loss function的优化求解，也就是optimization。为了求解loss function我们首先将loss function 可视化

Visualizing the loss function

一般来说在图像处理的时候我们结果的数据都是多维的，前面CIFAR-10 的图片有3072维，一共10类，那么我们需要的参数就有30730个数据（表忘了还有b噢），显然无法将这么多维数据直接可视化，我们的方法是：先随机选一个初始的参数向量（30730个参数），然后给定一个变化的方向，每次沿这个方向变化一点就可以得到沿这个方向变化的所有参数的表现情况（一维可视化 $L(W + a W_1)$ ），如果我们给定了两个变化的方向，就可以在二维平面将其可视化( $L(W + a W_1+b W_2)$ )，如下图：
这里写图片描述
这里左侧是以个方向的变化情况，纵坐标是loss值，右侧是两个方向变化得到的loss值（蓝色代表小的loss），左侧和中间是在一个数据上得到的loss，最右侧是在100个样本中得到的loss之后取的平均值。
我们可以这样解释loss function的分段线性：
假设我们有三个样本，使用svm分类，分类器只有一个参数w，那么我们可以得到三个样本的loss 函数：

L 0 = L 1 = L 2 = L = max (0, w T 1 x 0 - w T 0 x 0 + 1) + max (0, w T 2 x 0 - w

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。