正则化、线性回归、逻辑回归

最新推荐文章于 2023-08-23 20:43:51 发布

MinJinFan

最新推荐文章于 2023-08-23 20:43:51 发布

阅读量887

点赞数

分类专栏： Machine Learning 文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37264323/article/details/105643781

版权

本文介绍了如何利用正则化解决过拟合问题，分析了过拟合的原因，并详细阐述了正则化的概念及其在线性回归和逻辑回归中的应用。通过正则化，可以降低模型复杂度，防止过拟合，同时保持模型的预测能力。

摘要由CSDN通过智能技术生成

0、引出

最左边的模型最高次项为一次，此时模型是一条直线；直观的观察样本点（红色×）的趋势，我们发现该模型并不能很好的拟合两者的关系（事实上，随着房子面积增大，住房价格的变化趋于稳定或者说越往右越平缓，而不是无限递增）。此类情况称为欠拟合。

最右边的模型最高次项为四次，此时模型从表面看上去很好的拟合了样本点，但实际上这是一条非常难看的曲线，不断的波动。可以想象得到，当一个新的样本需要预测时，该模型的结果也不准确，这类情况叫做过拟合。

中间的模型，参数不多不少，刚好能反应面积Size和价格Price之间的真实关系，而它的最高次项是二次。

这也就引出了一个问题，该怎么控制多项式的最高次幂？(也就是特征的个数)。对于这个问题其实我们只需要 $x,x^{2}$ 这两个特征，而 $x^{3},x^{4}$ 是不需要的。所以尽可能的降低 $x^{3},x^{4}$ 的权重，也就是让其系数 $x^{3},x^{4}$ 尽可能的小。最好趋近于零，这样就ok了。

一、利用正则化解决过拟合问题

造成过拟合的可能原因：

1、特征数量太多（对应上例中就是特征值过多，即

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。