正则化（L1和L2范数）

最新推荐文章于 2024-07-10 14:17:40 发布

Aliz_

最新推荐文章于 2024-07-10 14:17:40 发布

阅读量2.5k

点赞数

分类专栏： Deep Learning 文章标签： L2 L1 正则化

本文链接：https://blog.csdn.net/weixin_41417982/article/details/81544886

版权

本文探讨了正则化在防止过拟合中的作用，特别是L1和L2范数的应用。L1范数通过使部分权重趋于零实现参数稀疏，而L2范数通过权重衰减避免复杂模型。正则化不仅限于这两种形式，还包括Dropout、批量归一化等其他方法来提高模型的泛化能力。

摘要由CSDN通过智能技术生成

说实话，这么后才来写正则化是挺奇怪的。

相信大家都知道损失函数，是用来描述我们模型与训练数据之间的差距（即是否能准确拟合训练数据）。但其实我们真正在实战用的是目标函数。目标函数的构造是：损失函数+正则化。

参考
https://blog.csdn.net/zouxy09/article/details/24971995 (大神）
http://www.cnblogs.com/ooon/p/4964441.html
https://blog.csdn.net/li8zi8fa/article/details/77649973

为什么需要正则化

我们先来假设，如果分类时我们的损失 $Loss=0$ 出现的情况。那就是，对于每一个训练的数据，我们都能正确输出它的类别。这听起来很好，是百分百的正确。但事实上，我们应用这个模型的场景并不是训练的数据，而是测试的数据。因此我们把这个问题称为过拟合（Overfitting)

图片来自于： https://baijiahao.baidu.com/s?id=1591715304965529269&wfr=spider&for=pc

我们可以换个说法。假如我们想训练猫这个分类，但是我们刚好训练集都是橘猫，如果我们过拟合了，它提取的特征不再是猫身，猫尾这些形状，反而会执着于提取肥硕的猫身（哈哈哈哈），黄色的尾巴。但其实我们更想让它适应的范围变大（泛化能力变强），即检测猫这个分类的特征而不是橘猫的特征。所以我们加入了正则化，来使得这个模型不会过拟合。

https://www.zhihu.com/question/32246256 知乎有很多搞笑生动的例子。