cs231n笔记：损失函数（loss function）和正则化（regularization）

最新推荐文章于 2024-01-17 21:47:00 发布

未来可期，期许未来

最新推荐文章于 2024-01-17 21:47:00 发布

阅读量949

点赞数

分类专栏： CS231n笔记

本文链接：https://blog.csdn.net/pangpangben/article/details/116015787

版权

CS231n笔记专栏收录该内容

9 篇文章

订阅专栏

损失函数（loss function）
量化模型的好坏

a dataset of examples:
在这里插入图片描述
loss:

简单介绍一下SVM:
SVM(support vector machine):支持向量机，是一种二分类模型。基本思想是求解能够正确划分训练数据集并且使几何间隔最大的分离超平面（具有唯一性）。

multi-class SVM loss:
在这里插入图片描述
公式里的1（边界）只是一个任意的选择，，关心分数的相对差值。
SVM损失函数只关注正确的分数比不正确的分数是否大于1，若大于1，则损失为0.
下面这个图是对SVM公式的理解：

def L_i_vectorized(x,y,w):
	scores = W.dot(x)
	margins = np.maximum(0, scores - scores[y] + 1)
  	margins[y] = 0 #j不等于y(对正确分类的归零)
 	loss_i = np.sum(margins)
	return loss_i

如果发现在w下，L=0，但是W并不唯一，2W，3W…也会使L=0.

增加正则化在loss中：
在这里插入图片描述
第一项为data loss(model predictions should match training data)
第二项为正则化(model should be simple)，目的是减轻模型的复杂度，防止过拟合，增强泛化能力，其中拉姆达是超参数，平衡data loss和regularization