白话图解机器学习里的Regularization正则化

最新推荐文章于 2024-02-22 17:02:09 发布

yueyueniaolzp

最新推荐文章于 2024-02-22 17:02:09 发布

阅读量1k

点赞数

分类专栏：深度学习文章标签：机器学习深度学习

本文链接：https://blog.csdn.net/yueyueniaolzp/article/details/122083986

版权

深度学习专栏收录该内容

14 篇文章 3 订阅

订阅专栏

概念

概念：Regularization，直译为规范化; 正则; 规则化调整; 正则化; 规则化。是一种约束性调整策略。个人理解：向模型加入某些规则（约束条件，含先验知识），缩小解空间，减小求出错误解的可能性，也就是增强模型泛化能力的一种手段。

【正则化】这一称呼貌似是小gui子的翻译。

出处：线性代数理论
目的：求解不适定问题。机器学习中主要为了防止过拟合，如在下图中舍红线取绿线。

方法

本质：机器学习领域中，LogisticRegression逻辑回归也罢，SVM支持向量机也罢，亦或简单的LinearModel，设定其base function为 $\phi \left ( \chi \right )$ ，通过对cost function求极值来确定 $\phi \left ( \chi \right )$ 中一系列parameters。最终模型的确定即依赖于这些parameters。
方法：
1、参数正则化方法——L1/L2范数
2、隐式正则化方法
3、深度学习中的Early Stopping
4、深度学习中的dropout

5、深度学习中的image augmentation

图解

引用李航《统计学习方法》中的描述：规则化是结构风险最小化策略的实现，是在经验风险最小化上加一个规则化项（regularizer）或罚项（penalty term）。规则化项一般是模型复杂度的单调递增函数，模型越复杂，规则化值就越大。比如，规则化项可以是模型参数向量的范数。
下面详述L1/L2范数作为规则化项：