[深度学习] 网络正则化

最新推荐文章于 2022-11-03 16:41:26 发布

置顶

四月晴

最新推荐文章于 2022-11-03 16:41:26 发布

阅读量3.4k

点赞数 1

分类专栏：计算机视觉计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/siyue0211/article/details/80278883

版权

网络正则化是防止深度学习模型过拟合、提高泛化能力的关键。本文介绍了正则化原理，包括L2正则化、L1正则化、最大范数约束和随机失活（dropout），并强调了验证集在模型训练中的作用。L2正则化通常优于L1正则化，而dropout不仅可以约束模型复杂度，还能实现集成学习的效果。

摘要由CSDN通过智能技术生成

网络正则化

机器学习的核心问题是如何使学习算法不仅在训练样本上表现良好，而且在新数据上或测试集上同时奏效，学习算法在新数据上的这样一种表现我们称之为模型的泛化能力。如果一个学习算法在训练集表现优异，同时在测试集依然工作良好，可以说该学习算法有较强的泛化能力。若某算法在训练集表现优异，但是测试集却非常糟糕，我们说这样的学习并没有泛化能力，这种现象也叫做过拟合（overfitting）。
如何避免过拟合？我们可以使用正则化的技术来防止过拟合的情况。正则化是机器学习中通过显示的控制模型复杂度来避免模型过拟合，确保泛化能力的一种有效方式。
许多浅层学习器（如支持向量机等）为了提高泛化能力往往都需要依赖模型的正则化，深度学习也应如此。深度网络模型相比浅层学习器巨大的多的模型复杂度时把更锋利的双刃剑：保证模型更强大的同时也蕴含着过拟合的风险。深度模型的正则化可以说是整个深度模型搭建的最后一步，更是不可或缺的一步。下面将介绍五种实践中常用的卷积神经网络的正则化方法。

正则化原理

对于目标函数：

m i n (1 N \sum i = 1 n (y i - f (x i)

最低0.47元/天解锁文章

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。