[深度学习]更好地理解正则化：可视化模型权重分布

最新推荐文章于 2024-07-26 16:27:45 发布

koishi70

最新推荐文章于 2024-07-26 16:27:45 发布

阅读量3.7k

点赞数 5

分类专栏：深度学习文章标签：深度学习正则化机器学习可视化数学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yuweiming70/article/details/81513742

版权

本文通过可视化方法探讨正则化在深度学习中的作用，对比L1和L2正则化对模型权重分布的影响。实验发现，L1更快地使权重向0聚集，而L2在后期才有类似效果。正则化能提高模型泛化能力并减少存储需求。同时，介绍了自定义正则化函数的可能性。

摘要由CSDN通过智能技术生成

在机器学习中，经常需要对模型进行正则化，以降低模型对数据的过拟合程度，那么究竟如何理解正则化的影响？本文尝试从可视化的角度来解释其影响。

首先，正则化通常分为三种,都是在loss函数的基础上外加一项：

L0： $\lambda\times||x||_{0}$ ，即不等于0的元素个数

L1： $\lambda\times||x||_{1}$ ，即所有元素的绝对值之和

L2： $\lambda\times||x||_{2}$ ，即所有元素的绝对值平方和

训练模型的时候，模型将在保证loss主体损失下降的情况下，尽量保证权重往这些方向走，从L1,L2的函数中就可以看出，在做梯度下降的时候，这些函数都将把权重赶向接近0的地方，让权重变得更加稀疏，大部分数据都在0附近。

从最小化结构风险的角度来看（这个和奥卡姆剃刀律有异曲同工之妙），在多个模型中，我们选择最简单的那个模型作为最好的模型，而不是最复杂的，权重分布最离散的那个。

从人类的角度来看，神经元（千亿量级&#x

最低0.47元/天解锁文章

关注

5
点赞
踩
15

收藏

觉得还不错? 一键收藏
4
评论
[深度学习]更好地理解正则化：可视化模型权重分布

在机器学习中，经常需要对模型进行正则化，以降低模型对数据的过拟合程度，那么究竟如何理解正则化的影响？本文尝试从可视化的角度来解释其影响。首先，正则化通常分为三种,都是在loss函数的基础上外加一项：L0：，即不等于0的元素个数L1：，即所有元素的绝对值之和L2：，即所有元素的绝对值平方和训练模型的时候，模型将在保证loss主体损失下降的情况下，尽量保证权重往这些方向...
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。