机器学习中的正则化(Regularization)

最新推荐文章于 2024-07-25 17:01:05 发布

Zero黑羽枫

最新推荐文章于 2024-07-25 17:01:05 发布

阅读量344

点赞数

分类专栏：机器学习文章标签：机器学习正则化 regularization

本文链接：https://blog.csdn.net/Zero_HeiYuFeng/article/details/88931061

版权

本文介绍了机器学习中的正则化技术，包括正则化的概念和目的，如减少测试误差和防止过拟合。重点讲解了L1和L2正则化的区别，L1正则化通过引入特征系数绝对值的和导致特征稀疏，适合特征选择，而L2正则化通过特征系数平方和使得模型简单，防止过拟合。此外，还讨论了训练集增强、dropout和early stopping等正则化方法，并结合实例解释了它们的作用。

摘要由CSDN通过智能技术生成

文中部分图片摘自吴恩达deeplearning课程的作业，代码及课件在我的github：
DeepLearning 课件及作业

关于本篇正则化的具体路径是：
正则化作业

正则化的概念及原因

简单来说，正则化是一种为了减小测试误差的行为(有时候会增加训练误差)。我们在构造机器学习模型时，最终目的是让模型在面对新数据的时候，可以有很好的表现。当你用比较复杂的模型比如神经网络，去拟合数据时，很容易出现过拟合现象，这会导致模型的泛化能力下降，这时候，我们就需要使用正则化，让训练出来的模型没有那么复杂。

正则化的几种常用方法

L1 & L2范数

首先介绍一下范数的定义，假设 $x$ 是一个向量，它的 $L^p$ 范数定义:
$||x||_p = (\sum_{i}^{}{|x_i|^p})^\frac{1}{p}$
在目标函数后面添加一个系数的“惩罚项”是正则化的常用方式，为了防止系数过大从而让模型变得复杂。在加了正则化项之后的目标函数为:
$\bar{J}(w, b) = J(w, b) + \frac{\lambda}{2m}\Omega(w)$
式中， $\frac{\lambda}{2m}$ 是一个常数， $m$ 为样本个数， $\lambda$ 是一个超参数，用于控制正则化程度。

$L^1$ 正则化时，对应惩罚项为 :
$\Omega(w)=||w||_1 = \sum_{i}^{}{|w_i|}$

最低0.47元/天解锁文章

Zero黑羽枫

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习中的正则化(Regularization)

文中部分图片摘自吴恩达deeplearning课程的作业，代码及课件在我的github：DeepLearning 课件及作业关于本篇正则化的具体路径是：正则化作业正则化的概念及原因简单来说，正则化是一种为了减小测试误差的行为(有时候会增加训练误差)。我们在构造机器学习模型时，最终目的是让模型在面对新数据的时候，可以有很好的表现。当你用比较复杂的模型比如神经网络，去拟合数据时，很容易出...
复制链接

扫一扫

专栏目录