机器学习(三)回归问题之Robust Regression

最新推荐文章于 2024-08-29 09:45:37 发布

Raywit

最新推荐文章于 2024-08-29 09:45:37 发布

阅读量4.2k

点赞数 4

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40520596/article/details/105383434

版权

机器学习专栏收录该内容

23 篇文章

订阅专栏

在这里插入图片描述
我们知道最小二乘法的误差函数是均方L2范数，接下来则是讨论 为什么均方回归会对异常点outliers敏感 以及 有没有更好的误差函数使得更好的处理outliers？
在这里插入图片描述

常见的误差函数：

在这里插入图片描述
上图可以看出，对于绝对值误差函数，发现在误差 x 在0的附近发现不可导，因此优化难以进行；而Huber完美解决这样的问题，在0附近可导，在大误差范围又兼具绝对值特性。

最小化均方L2范数 等价于假设误差服从独立等方差的 高斯分布 的最大似然估计；
最小化L1范数 等价于假设误差服从独立等方差的 拉普拉斯分布 的最大似然估计。

证明：

Q1： 为什么L2范数回归会对异常点outliers敏感，L1范数回归是否要比 L2范数回归鲁棒更好？

A1： 由于重尾分布。
在这里插入图片描述

根据上图可以看出在同方差的条件下，选取某段误差区间，例如：当 $\sigma =1$ ，误差 $x\in [0,\ 1]$ 时，可以发现Laplace更集中在误差小的范围，而Gauss包容更多误差大的点，因此对于异常点就更敏感些。

因此可以发现 L1范数回归 要比 L2范数回归 鲁棒更好。

更通俗来说：L2范数和L1范数分别评估的是“均值”和“中值”。
在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。