【机器学习】022_正则化

最新推荐文章于 2024-07-22 09:16:52 发布

Cyan.__

最新推荐文章于 2024-07-22 09:16:52 发布

阅读量40

点赞数

分类专栏：机器学习文章标签：机器学习人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Yukiice/article/details/134130258

版权

机器学习专栏收录该内容

45 篇文章 1 订阅

订阅专栏

一、解决过拟合的三种方法

· 增加数据量，增加训练数据集

· 尝试仅选择和使用功能的一个子集，即减少特征值的种类

· 使用正则化

二、正则化的算法思想

例：假设目前有一个模型，其用多项式拟合数据，但出现了过拟合的情况

· 减小过拟合的方法：

假若我们想要减小模型的过拟合情况，就必须对次数大的特征值次数项的参数作处理。

当参数值越小的时候，该次数项对于模型预测的影响也就变得更小。

因此，我们要让 $w_{3},w_{4}$ 尽可能地小。

由此，更改成本函数，加上一个较大的 $w_{3},w_{4}$ 项，促使模型向着使其值更小的方向改进。

· 但当实际完善模型的时候，我们可能不知道哪些特征值更重要，哪些更次要，因此，正则化一个常见的做法是对所有特征值的所有参数 $w_{1},w_{2},...,w_{n}$ 全部进行惩罚。

※ 一般而言，不对b进行惩罚。

三、更改成本函数以惩罚参数

· 惩罚：人为限制参数的大小，保证其值不过大导致模型过拟合

· 做法：在成本函数里额外增加一条算法来不断优化参数大小

· 上式中，第一部分用来判断拟合数据的好坏精度，第二部分用来惩罚参数 $w$ ，使其向着尽量小的方向不断更新值。

· 正则化参数： $\lambda$

$\lambda$ 指定了要缩小过拟合的程度，用来权衡过拟合和欠拟合之间的平衡。

假若 $\lambda$ 的值过大，会使得 $w$ 的值变得非常非常小，模型预测结果基本等于 $b$ ，导致欠拟合。

假若 $\lambda$ 的值过小，成本函数对 $w$ 的值的影响非常微弱， $w$ 数值依旧不得下降，导致过拟合。

因此，要选择介于两者之间的某个 $\lambda$ 值，最小化均方误差并保持参数较小。

四、线性回归正则方法

对于线性回归模型，在梯度下降算法中重复更新 $w,b$ 的值，以期获得合适的参数。

不同的是，通过该计算公式，我们可以看到，每次 $w$ 的值都被人为减去了 $\alpha \frac{\lambda }{m}$ 倍，这使得参数的值逐渐变小以防止过拟合。后面的部分则是正常的梯度下降拟合数据。

五、逻辑回归正则方法

利用同样的方法，对成本函数作处理，不断减小参数 $w$ 的值。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】022_正则化

【学习打卡】机器学习_022：学习了处理过拟合的一种方法：正则化及其算法思想；学习了如何改善成本函数以缩小参数值来避免过拟合的发生
复制链接

扫一扫

专栏目录

Cyan.__ CSDN认证博客专家 CSDN认证企业博客

码龄2年

47: 原创

42万+: 周排名

9万+: 总排名

9438: 访问

: 等级

506: 积分

23: 粉丝

34: 获赞

15: 评论

38: 收藏

私信

关注

热门文章

分类专栏

Linux 1篇
机器学习 45篇
C++ 1篇

最新评论

【机器学习】044_Kaggle房价预测（机器学习模型实战）
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
【机器学习】040_理解偏差与方差
白话机器学习: 博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，期待博主持续带来更多好文
【机器学习】041_模型开发迭代过程
白话机器学习: 内容丰富图文并茂，认真看完收获很大。思路清晰细节满满，支持大佬优质好文。
【机器学习】019_缺失值处理
CSDN-Ada助手: 恭喜你写完了第20篇博客！标题看起来非常有意思，关于缺失值处理的内容一定会对读者有所帮助。你在机器学习领域的持续创作让人佩服，真的很高兴看到你的进步。在下一步的创作中，或许可以考虑分享一些关于特征选择或者模型评估的技巧，这些主题也是非常受欢迎的。再次恭喜你，并期待你未来更多博客的发布！
【机器学习】001_监督学习与非监督学习
CSDN-Ada助手: 非常恭喜你开始了博客创作的旅程！标题看起来非常有吸引力，机器学习的内容一直备受关注。监督学习与非监督学习是机器学习中的两个重要概念，期待你能够深入探讨这两个主题，给读者带来更多的见解和启发。在下一步的创作中，或许可以考虑介绍一些具体的监督学习和非监督学习的算法或示例，这样读者能够更好地理解它们的应用和区别。再次祝贺你的第一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。