【AndrewNg机器学习】正则化(Regularization)

1 过拟合问题

如下图所示的回归问题,第一个模型是线性模型,欠拟合,不能很好地适应训练集;第三个模型就属于过拟合,太过于强调训练数据,而不能推广到新的数据,进行对新数据的预测。中间的模型最为合适。


在这里插入图片描述

同样的,在分类问题中也有这种现象:


在这里插入图片描述

如何处理过拟合问题:

  • 丢弃一些不能帮助我们正确预测的特征。可以手工选择保留哪些特征,或使用模型算法来帮忙
  • 正则化,保留所有的特征,但是减少参数的大小

2 正则化

在上面的回归问题中我们的过拟合模型为: h θ ( x ) = θ 0 + θ 1 x 1 + θ 2 x 2 + θ 3 x 3 + θ 4 x 4 h_\theta(x)=\theta_0+\theta_1x_1+\theta_2x_2+\theta_3x_3+\theta_4x_4 hθ(x)=θ0+θ1x1+θ2x2+θ3x3+θ4x4
可以看出,正是高次项导致了过拟合的产生,如果我们能让这些高次项接近0的话,就可以解决这个问题。所以我们要在一定程度上减小 θ 3 , θ 4 \theta_3,\theta_4 θ3,θ4的大小,即在代价函数上进行修改,在 θ 3 , θ 4 \theta_3,\theta_4 θ3,θ4上设置惩罚: min ⁡ θ 1 2 m [ ∑ i = 1 m ( h θ ( x ( i ) ) − y ( i ) ) 2 + 1000 θ 3 2 + 10000 θ 4 2 ] \min_\theta \frac{1}{2m}[ \sum_{i=1}^m (h_\theta(x^{(i)}) -y^{(i)} )^2 + 1000\theta_3^2 + 10000\theta_4^2 ] θmin2m1[i=1m(hθ(x(i))y(i))2+1000θ32+10000θ42]通过这样的代价函数,得到的 θ 3 , θ 4 \theta_3,\theta_4 θ3,θ

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值