【CV】吴恩达机器学习课程笔记 | 第7章

本系列文章如果没有特殊说明,正文内容均解释的是文字上方的图片
机器学习 | Coursera
吴恩达机器学习系列课程_bilibili

7 正则化

7-1 过拟合问题

在这里插入图片描述

  • 上图左侧坐标系为欠拟合,用一条直线不能很好的表示这个数据集,偏差很大
  • 上图中间为合适的拟合
  • 上图右侧为过度拟合,拟合的曲线波动很大,假定函数中的变量过多,虽然代价函数非常接近0,但不能泛化到其他数据集中
    在这里插入图片描述
  • 上图为在逻辑回归中的欠拟合、合适的拟合、过度拟合

在这里插入图片描述
解决过拟合:
1.减少特征数量
2.正则化

7-2 (正则化更改)代价函数

在这里插入图片描述
使用正则化更改代价函数

  • 直接使用上图右侧的假定函数及其代价函数会导致过拟合
  • 在不去掉 θ 3 θ_3 θ3 θ 4 θ_4 θ4的前提下,可以在代价函数上加上对于 θ 3 θ_3 θ3 θ 4 θ_4 θ4的惩罚项: 1000 θ 3 2 + 1000 θ 3 2 1000θ_3^2+1000θ_3^2 1000θ32+1000θ32,(1000只是随便一个比较大的数),加上惩罚项之后的代价函数在运算中会让参数 θ 3 θ_3 θ3 θ 4 θ_4 θ4变得尽可能小,让 θ 3 θ_3 θ3 θ 4 θ_4 θ4对假定函数的图像影响变小,这样就可以在保留 θ 3 θ_3 θ3 θ 4 θ_4 θ4参数的情况下不产生过拟合。

加上惩罚项后的假定函数变为:
J ( θ ) = 1 2 m [ ∑ i = 1 m C o s t ( h θ ( x ( i ) ) , y ( i ) ) + 1000 θ 3 2 + 1000 θ 3 2 ] J(θ)=\frac{1}{2m} \left[ \sum_{i=1}^mCost(h_θ(x^{(i)}),y^{(i)})+1000θ_3^2+1000θ_3^2 \right] J(θ)=2m1[i=1mCost(hθ(x(i)),y(i))+1000θ32+1000θ32]

由于我们一般不知道哪一项会导致过拟合,所以在代价函数中加入正则化项
加入后的代价函数为:
J ( θ ) = 1 2 m [ ∑ i = 1 m C o s t ( h θ ( x ( i ) ) , y ( i ) ) + λ ∑ j = 1 n θ j 2 ] J(θ)=\frac{1}{2m} \left[ \sum_{i=1}^mCost(h_θ(x^{(i)}),y^{(i)})+λ\sum_{j=1}^{n}θ_j^2 \right] J(θ)=2m1[i=1mCost(hθ(x(i)),y(i))+λj=1nθj2]
λ λ λ为正则化参数,一般不对 θ 0 θ_0 θ0增加惩罚项,所以 j j j 1 1 1开始

7-3 线性回归的正则化

在这里插入图片描述

  • 正则化后的梯度下降循环项如上图,由于在代价函数中没有添加对 θ 0 θ_0 θ0的惩罚项,所以对 θ 0 θ_0 θ0的更新分开表示
    在这里插入图片描述
  • 对于 j = 1 , 2 , 3 , . . . , n j=1,2,3,...,n j=1,2,3,...,n的梯度下降项也可化简为上图的式子
  • 可以得到 1 − α λ m 1-α\frac{λ}{m} 1αmλ是一个小于1但非常接近1的数

使用正则化后得到的正规方程为:
在这里插入图片描述

  • 这里只要 λ > 0 λ>0 λ>0,那么括号内计算得出的矩阵一定可逆
  • 而在原来没有用正则化得出的正规矩阵 θ = ( X T X ) − 1 X T y θ=(X^TX)^{-1}X^Ty θ=(XTX)1XTy中,如果 m < n m<n m<n(m为样本数,n为特征数),那么括号内矩阵不可逆(是奇异矩阵),所以正则化也可以应用于样本数小于特征数时的情况,让括号内矩阵可逆

7-4 逻辑回归的正则化

正则化后逻辑回归的代价函数改为:
J ( θ ) = − 1 m [ ∑ i = 1 m y ( i ) l o g ( h θ ( x ( i ) ) ) + ( 1 − y ( i ) ) l o g ( 1 − h θ ( x ( i ) ) ) ] + λ 2 m ∑ j = 1 n θ j 2 J(θ)=-\frac{1}{m}\left[\sum_{i=1}^my^{(i)}log(h_θ(x^{(i)}))+(1-y^{(i)})log(1-h_θ(x^{(i)}))\right]+\frac{λ}{2m}\sum_{j=1}^{n}θ_j^2 J(θ)=m1[i=1my(i)log(hθ(x(i)))+(1y(i))log(1hθ(x(i)))]+2mλj=1nθj2
在这里插入图片描述
正则化后的梯度下降循环项如上图

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Fannnnf

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值