吴恩达机器学习入门笔记5-正则化

5 正则化

给参数增加惩罚项,达到简化假设函数,降低过拟合的目的

5.1 正则化线性回归

5.1.1 正则化代价函数

(5.1) J ( θ ) = 1 2 m [ ∑ i = 1 m ( h θ ( x ( i ) ) − y ( i ) ) 2 + λ ∑ j = 1 n θ j 2 ] J(\theta)=\frac{1}{2 m}\left[\sum_{i=1}^{m}(h_{\theta}(x^{(i)})-y^{(i)})^{2}+\lambda \sum_{j=1}^{n} \theta_{j}^{2}\right]\tag{5.1} J(θ)=2m1[i=1m(hθ(x(i))y(i))2+λj=1nθj2](5.1)

右边加的项称为正则化项, λ \lambda λ称为正则化参数,有两个目标

  1. 更好地拟合训练集
  2. 保证1的同时尽量减小参数,保持假设模型简单避免出现过拟合情况
  • 一般约定不对 θ 0 \theta_0 θ0进行正则化
  • λ \lambda λ设置过大,参数会接近于0,导致假设函数只有 θ 0 \theta_0 θ0,即假设函数是一条水平直线,因此需要选择一个合适的正则化参数
5.1.2 正则化梯度下降

[外链图片转存失败(img-r6hfBavh-1568602397135)(E:\Artificial Intelligence Markdown\Machine Learning\pictures\5.1.2 正则化梯度下降.png)]

学习率 α \alpha α很小,样本量m很大,因此正则化即每次将参数向0方向缩小一点

5.1.3 正则化正规方程

(5.2) θ = ( X T X + λ [ 0 1 1 ⋱ 1 ] ) − 1 X T y \theta=\left(X^{T} X+\lambda\left[\begin{array}{cccc}{0} \\ {} & {1} \\ {} & {} & {1} \\ {} & {} & {} & {\ddots} \\ {} & {} & {} & {1}\end{array}\right]\right)^{-1} X^{T} y\tag{5.2} θ=XTX+λ01111XTy(5.2)

其中加入的矩阵为(n+1)×(n+1)维

  • 如果样本量m小于特征变量个数n,则 X T X X^TX XTX不可逆,为奇异矩阵,但只要 λ > 0 \lambda>0 λ>0,可确保矩阵和非奇异

5.2 正则化逻辑回归

5.2.1 正则化代价函数

(5.3) J ( θ ) = − [ 1 m ∑ i = 1 m y ( i ) log ⁡ h θ ( x ( i ) ) + ( 1 − y ( i ) ) log ⁡ ( 1 − h θ ( x ( i ) ) ) ] + λ 2 m ∑ j = 1 n θ j 2 \begin{aligned} J(\theta)=-[\frac{1}{m}\sum_{i=1}^{m} y^{(i)} \log h_{\theta}(x^{(i)})+(1-y^{(i)}) \log (1-h_{\theta}(x^{(i)}))]+\frac{\lambda}{2m}\sum_{j=1}^{n}\theta_j^2 \end{aligned}\tag{5.3} J(θ)=[m1i=1my(i)loghθ(x(i))+(1y(i))log(1hθ(x(i)))]+2mλj=1nθj2(5.3)

  • 计算后一项记得从j=1开始,因为不正则化 θ 0 \theta_0 θ0
5.2.2 正则化梯度下降

[外链图片转存失败(img-ZzgwHxme-1568602397136)(E:\Artificial Intelligence Markdown\Machine Learning\pictures\5.2.2 正则化梯度下降.png)]

5.2.3 正则化高级算法

[外链图片转存失败(img-gkcWAE8y-1568602397139)(E:\Artificial Intelligence Markdown\Machine Learning\pictures\5.2.3 正则化高级算法.png)]

5.3 正则化与偏差方差的关系

[外链图片转存失败(img-Clhl2T6h-1568602397141)(E:\Artificial Intelligence Markdown\Machine Learning\pictures\5.3 正则化与偏差方差的关系.png)]

λ \lambda λ越大,训练集和验证集的偏差越大, λ \lambda λ越小,训练集的误差越小,验证集的方差越大

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值