Stanford 机器学习笔记 Week3 Regularization

Regularization

The Problem of Overfitting

拟合效果不好有两种情况:

欠拟合(Underfitting),指的是预测值和training set匹配程度较差。

过拟合(Overfitting),指的是拟合曲线过度追求吻合training set,可能被一些噪音干扰,偏离实际情况。当

数据的参数过多时容易发生这种情况。

解决过拟合有两种方法:

1.减少参数数量,可以人为选择使用哪些参数,也可使用模型选择算法(后面会讲)。但是这可能会导致丢

失信息。

2.正则化(regularization),调整每个参数的权重。

Cost Function

θ参数越小,曲线将会越平滑,越不容易Overfitting。

因此构造新的Cost Function

这里写图片描述
这个函数的前半部分(原Cost Function),控制拟合曲线尽量接近training set,后半部分控制θ参数尽可能

小。正则参数λ控制正则化的程度,λ越大拟合曲线的匹配程度越小。

Regularized Linear Regression

正则化的梯度下降公式为:

这里写图片描述
(j>0)

因此(1-a*λ/m)需要<1才能起到逐步缩小θ的作用。

正则化的正规方程法公式:

这里写图片描述

X是一个m*n矩阵,如果m<=n,那么X’ * X将是一个奇异矩阵(没有逆),pinv也许能得出一个答案,因为

这求得其实是伪逆矩阵,inv则无法得出答案。幸运的是正则化也可以解决这个问题,当λ大于0时,上面这个

新矩阵一定是非奇异的。

Regularized Logistic Regression

正则化的梯度下降方程:

θ2 =θ2 - 这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值