正则化的概念

不许知道我是谁

于 2024-03-06 10:16:07 发布

阅读量541

点赞数 7

文章标签：人工智能算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_82757200/article/details/136476438

版权

正则化（Regularization）：是机器学习中用于减少泛化误差（测试误差），从而缓解过度拟合的设计策略。当使用正则化策略减少泛化误差时，可能会增大训练误差。

针对线性回归模型，假设对其代价函数里加入正则化项，其中L1和L2正则化项的表示分别如下所示，其中λ >= 0，是用来平衡正则化项和经验风险的系数。

优点：减少泛化误差，减少过拟合

缺点：增大训练误差

基本名词

L1-norm ：(L1范数)

L2-norm：(L2范数)

L1-regularization 和 L2-regularization ：正则项

norm：一个向量的 norm 就是将该向量投影到 [0, ∞) 范围内的值，其中 0 值只有零向量的 norm 取到。将其与现实中距离进行类比，在机器学习中 norm 也就总被拿来表示距离关系：根据范数取值多大，这两个向量距离多远。这里范数的取值就是范数的种类，即Lp-norm：

当p=1时，被称为1-norm，也就是L1-norm，

当p=2时，被称为2-norm，也就是L2-norm。

L1 范数和 L2 范数在机器学习上最主要的应用大概分下面两类：

（1）作为损失函数使用

（2）作为正则项使用也即所谓 L1-regularization 和 L2-regularization

最小化损失函数，其实就是最小化预测值和目标值的绝对值。

L1-norm损失函数，又称为最小绝对偏差 (least absolute deviation,LAD)。：特征选择

LAD：预测值与真实值之间的绝对值

优点：鲁棒性更强，对异常值更不敏感

正则化方式：减小模型参数，尽管都能简化模型

假定参数符合拉普拉斯分布

模型也被叫作Lasso回归

L2-norm损失函数，又称为最小二乘误差（least squares error, LSE）：抗过拟合的能力更好一点

优点：

计算方便，可以直接求导获得取最小值时各个参数的取值。
用L2一定只有一条最好的预测线

正则化方式：产生稀疏解，实际上是减少特征数量。

假定参数符合高斯分布。

模型也被叫作Ridge回归

逻辑回归需要做正则化吗？

逻辑回归模型的输出是经过softmax的概率值，概率值的排序不受归一化的影响。从另一个角度来看，softmax其实也就实现了归一化的目的。
逻辑回归模型的参数优化一般采用了梯度下降法，如果不对特征进行归一化，可能会使得损失函数值得等高线呈椭球形，这样花费更多的迭代步数才能到达最优解。
逻辑回归模型的损失函数可以加入正则项，那么参数的大小便决定了损失函数值，特征就有必要先进行归一化。

在逻辑回归模型中，归一化还是有必要的，尤其是在正则化和梯度下降中所起到的作用。

参考链接：
https://blog.csdn.net/w__Y__w/article/details/121792038

【机器学习基础】一文搞懂机器学习里的L1与L2正则化-腾讯云开发者社区-腾讯云

逻辑回归+正则化 - 知乎：python

不许知道我是谁

关注

7
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

不许知道我是谁 CSDN认证博客专家 CSDN认证企业博客

码龄1年

5: 原创

138万+: 周排名

22万+: 总排名

4661: 访问

: 等级

132: 积分

66: 粉丝

82: 获赞

3: 评论

64: 收藏

私信

关注

热门文章

分类专栏

最新评论

tableone详细解析（3）------连续型变量和分类变量
CSDN-Ada助手: 恭喜作者继续分享关于tableone的详细解析，这篇关于连续型变量和分类变量的内容非常有启发性。希望作者可以在下一篇博客中加入实际案例或者数据分析的应用，让读者更好地理解和运用这些知识。期待作者的下一步创作！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
协方差矩阵-----------------------奇异值
CSDN-Ada助手: 恭喜你写了这么精彩的一篇博客！协方差矩阵和奇异值确实是一个很有深度的话题，而且你的解释也非常清晰易懂。希望你能继续保持写作的热情，不断分享你的知识和见解。下一步，也许可以考虑探讨一下协方差矩阵和奇异值在实际应用中的具体案例，或者是它们在机器学习领域的相关研究进展。期待你的更多精彩内容！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
tableone详细解析（1）------分类变量
CSDN-Ada助手: MySQL入门技能树或许可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
tableone详细解析（1）------分类变量
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/618149044。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。