正则化、线性回归、逻辑回归

本文介绍了如何利用正则化解决过拟合问题,分析了过拟合的原因,并详细阐述了正则化的概念及其在线性回归和逻辑回归中的应用。通过正则化,可以降低模型复杂度,防止过拟合,同时保持模型的预测能力。
摘要由CSDN通过智能技术生成

 0、引出

最左边的模型最高次项为一次,此时模型是一条直线;直观的观察样本点(红色×)的趋势,我们发现该模型并不能很好的拟合两者的关系(事实上,随着房子面积增大,住房价格的变化趋于稳定或者说越往右越平缓,而不是无限递增)。此类情况称为欠拟合。

最右边的模型最高次项为四次,此时模型从表面看上去很好的拟合了样本点,但实际上这是一条非常难看的曲线,不断的波动。可以想象得到,当一个新的样本需要预测时,该模型的结果也不准确,这类情况叫做过拟合。

中间的模型,参数不多不少,刚好能反应面积Size和价格Price之间的真实关系,而它的最高次项是二次。

这也就引出了一个问题,该怎么控制多项式的最高次幂?(也就是特征的个数)。对于这个问题其实我们只需要x,x^{2}这两个特征,而x^{3},x^{4}是不需要的。所以尽可能的降低x^{3},x^{4}的权重,也就是让其系数 x^{3},x^{4}尽可能的小。最好趋近于零,这样就ok了。

一、利用正则化解决过拟合问题

造成过拟合的可能原因:

  • 1、特征数量太多(对应上例中就是特征值过多,即
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值