机器学习(三)回归问题之Robust Regression

 
 
在这里插入图片描述
        我们知道最小二乘法的 误差函数 是 均方L2范数,接下来则是讨论 为什么均方回归会对异常点outliers敏感 以及 有没有更好的误差函数使得更好的处理outliers?
                        在这里插入图片描述

常见的误差函数:
                在这里插入图片描述
                在这里插入图片描述

在这里插入图片描述
        上图可以看出,对于绝对值误差函数,发现在误差 x 在0的附近发现不可导,因此优化难以进行;而Huber完美解决这样的问题,在0附近可导,在大误差范围又兼具绝对值特性。

  • 最小化均方L2范数 等价于 假设误差服从独立等方差的 高斯分布 的最大似然估计;
  • 最小化L1范数 等价于 假设误差服从独立等方差的 拉普拉斯分布 的最大似然估计。

证明:
在这里插入图片描述

 


Q1: 为什么L2范数回归会对异常点outliers敏感,L1范数回归是否要比 L2范数回归鲁棒更好?

A1: 由于重尾分布。
在这里插入图片描述

        根据上图可以看出在同方差的条件下,选取某段误差区间,例如:当 σ = 1 \sigma =1 σ=1,误差 x ∈ [ 0 ,   1 ] x\in [0,\ 1] x[0, 1]时,可以发现Laplace更集中在误差小的范围,而Gauss包容更多误差大的点,因此对于异常点就更敏感些。

         因此可以发现 L1范数回归 要比 L2范数回归 鲁棒更好。


更通俗来说:L2范数和L1范数分别评估的是“均值”和“中值”。
        在这里插入图片描述
        在这里插入图片描述

  • 4
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值