CS231N斯坦福计算机视觉公开课 02 - 损失函数和优化

最新推荐文章于 2024-05-15 22:54:11 发布

T4neYours

最新推荐文章于 2024-05-15 22:54:11 发布

阅读量255

点赞数 1

分类专栏： CS231N斯坦福计算机视觉公开课文章标签：计算机视觉算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Insistence0807/article/details/128382366

版权

CS231N斯坦福计算机视觉公开课专栏收录该内容

4 篇文章 1 订阅

订阅专栏

CS231N斯坦福计算机视觉公开课 02 - 损失函数和优化

一、SVM铰链损失函数
二、正则化
- 1.引入原因
三、Softmax交叉熵损失函数
四、优化过程
- 1.梯度下降算法

一、SVM铰链损失函数

分类错误的分数减去分类正确的分数再加1，比较这个数和0的大小关系，取最大值

猫猫的SVM loss为：max(0 , 5.1 - 3.2 + 1) + max(0,- 1.7 - 3.2 + 1) = 2.9+0 = 2.9

在这里插入图片描述

二、正则化

1.引入原因

由于同一个损失函数可以有多种变形算法（如将所有分数乘以2后再进行SVM loss计算），但是我们需要的是最简单的计算方法，所以我们引入正则化的概念
正则化可以让权重、模型在测试集上更好的泛化

正则化：

在常规损失函数的项后添加一个正则化的项，用正则化参数 $\lambda$ 表示正则化的强度
一些正则化方法
L1、L2正则化，以及它们的线性组合
Dropout正则化……

在这里插入图片描述

举例：

我们得到了 $w_1$ 、 $w_2$ 两个权重向量，他们与输入的 $x$ 的乘积是相同的
但是引入L2正则化函数后，计算出来的正则化项中， $w_1$ 对应的正则化项还是1， $w_2$ 对应的正则化项是 $0.25^2*4$ ，明显小于1，所以我们可以选出像 $w_2$ 这样较为平均的权重，而不是像 $w_1$ 这样一家独大的权重

在这里插入图片描述

可以把上述的 $w_2$ 看做是下图中的 $f_2$ ，把上述的 $w_1$ 看做是下图汇总的 $f_1$ ，往往更简单的模型的泛化能力更强（此图也可以帮助理解泛化能力的含义），也可以有效的防止过拟合

在这里插入图片描述

三、Softmax交叉熵损失函数

工作原理

首先将所有的分数作 指数变化
然后将变化后的分数做归一化（分子为该分数、分母为所有分数的和）
将正确的类别对应的分数作交叉熵损失函数（对数似然损失函数、负对数损失函数，一个意思），即-log(分数)，此数值越接近于0，正确类别的分数越高

在这里插入图片描述

四、优化过程

1.梯度下降算法

求得损失函数对于每一个权重的梯度（偏导数），按照梯度的反方向乘以学习率去更新权重
“下降”指的是使得损失函数下降，而不是使得梯度本身下降

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
CS231N斯坦福计算机视觉公开课 02 - 损失函数和优化

本文介绍了损失函数以及梯度下降的内容
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。