什么是正则化,为什么正则化能减少过拟合?(机器学习)

最新推荐文章于 2024-07-24 16:17:58 发布

执着的猫

最新推荐文章于 2024-07-24 16:17:58 发布

阅读量967

点赞数

分类专栏：机器学习文章标签：机器学习深度学习正则化

原文链接：https://www.jianshu.com/p/a9cc62db419e

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

正则化（Regularization):机器学习中为损失函数加一个额外项,一般为参数w的L1范数和L2范数,这种行为被称作正则化.

额外项是L1范数叫L1正则化:形式如下图(C0为原损失函数,lamda为正则化系数)

图1

额外项是L2范数叫L2正则化:形式如下图

图2

为什么正则化能减少过拟合?

过拟合表现在训练数据上的误差非常小，而在测试数据上误差反而增大。其原因一般是模型过于复杂，过分得去拟合数据的噪声和outliers. 正则化则是对模型参数添加先验，使得模型复杂度较小，对于噪声以及outliers的输入扰动相对较小。

过拟合的时候，拟合函数的系数往往非常大，为什么？如下图所示，过拟合，就是拟合函数需要顾忌每一个点，最终形成的拟合函数波动很大。在某些很小的区间里，函数值的变化很剧烈。这就意味着函数在某些小区间里的导数值（绝对值）非常大，由于自变量值可大可小，所以只有系数足够大，才能保证导数值很大。

而正则化是通过约束参数的范数使其不要太大，所以可以在一定程度上减少过拟合情况。

避免过拟合的方法有很多：

early stopping
数据集扩增（Data augmentation）
正则化（Regularization）包括L1、L2（L2 regularization也叫weight decay）
dropout。

这里只说了正则化

参考文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
什么是正则化,为什么正则化能减少过拟合?(机器学习)

正则化（Regularization):机器学习中为损失函数加一个额外项,一般为参数w的L1范数和L2范数,这种行为被称作正则化. 额外项是L1范数叫L1正则化:形式如下图(C0为原损失函数,lamda为正则化系数)图1额外项是L2范数叫L2正则化:形式如下图图2为什么正则化能减少过拟合?过拟合表现在训练数据上的误差非常小，而在测试数据上误差反而增大。其原因一般是模型过于复杂，过分得去拟合数...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。