机器学习--正则化(regularization)防止分类器过拟合

本文介绍了过拟合的概念及其在模型训练中的问题,提出了正则化作为避免过拟合的有效方法。正则化通过调整模型参数,降低特征权重,提升模型的泛化能力。分别详细讲解了线性回归和逻辑回归的正则化过程,包括代价函数的修改和梯度下降法的更新规则。
摘要由CSDN通过智能技术生成

本文参考吴恩达《机器学习》课程。

要介绍正则化,先要介绍一下过拟合的概念。

1 过拟合(overfitting)

         拿线性回归中(房价-房子面积)为例,如下图,最左边那幅图中,我们用线性回归(一次函数,因为只有一个特征size)来进行拟合,可以看到拟合出来的线大致反应出房价的趋势,但是并没有很好的拟合,这种情况我们称之为欠拟合(underfitting);为了更好的拟合,中间图我们用二次函数(即令x1=2, x2=x^2)来进行拟合,可以看到曲线很好的跟踪了样本点(样本点基本就在曲线的附近);当我们用更高的阶来拟合样本点时,如最右边图所示,可以看到样本点很好的落在曲线上,但是显然的,这条曲线不是一条好的预测曲线,当再来一个新的样本点,我们进行预测时,这条曲线的预测能力会很差,因为它过分的去拟合了训练样本,从而不再适应于新的样本,我们称这种情况叫过拟合(overfitting)。同时,我们也会说这条曲线的泛化能力很差(一个从训练集得到的模型是否能够很好的泛化到新的样本上,称为这个模型的泛化能力)。通俗的理解过拟合:过分的拟合了训练样本,也就是说,模型不仅学习了样本的一般特性,还把样本的个体特殊特性也学习了,从而,当模型应用到新来的数据时,效果不是很好。

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值