回归分析系列22— 稳健回归

技术与健康

于 2024-08-26 07:51:01 发布

阅读量328

点赞数 11

分类专栏：回归分析文章标签：线性回归

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/Practicer2015/article/details/141215882

版权

回归分析专栏收录该内容

25 篇文章 4 订阅 ¥9.90 ¥99.00

订阅专栏

23章稳健回归

23.1 简介

稳健回归是一种在数据中存在异常值或噪声时，依然能够提供合理估计的回归方法。传统的线性回归对异常值非常敏感，因为它最小化的是平方误差。这意味着大的离群点会对回归系数产生很大影响。

23.2 常见的稳健回归方法

稳健回归方法通过对异常值降低权重，或者对损失函数进行修正，以减少这些点对模型的影响。常见的稳健回归方法包括：

M估计：通过改变损失函数，使得它对异常值不敏感。
RANSAC：随机抽样一致性方法，通过随机选择样本，迭代寻找最佳模型。
LAD回归：最小绝对偏差回归，最小化绝对误差，而不是平方误差。

在Python中，我们可以使用scikit-learn中的RANSACRegressor或HuberRegressor来实现稳健回归。

from sklearn.linear_model import HuberRegressor
from sklearn.metrics import mean_absolute_error
import numpy as np

# 生成模拟数据，添加异常值
np.random.seed(42

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

技术与健康

关注关注

11
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

订阅专栏

谢宇《回归分析》_配套数据_谢宇回归分析配套数据_谢宇回归分析_

10-02

理工工科科研回归分析，谢宇版本配套资料及数据

[R语言]稳健回归

Xiaoling19的博客

12-30

7163

原文来自：稳健回归 INTRODUCTION 我们以线性回归中的一些概念开始关于稳健回归的讨论。残差：预测值（基于回归方程）与实际观察值之间的差。离群值：在线性回归中，离群值是具有大量残差的观察值。换句话说，鉴于其对预测变量的价值，这是一个因变量不寻常的观察结果。离群值可能表示样本特性，或者可能表示数据输入错误或其他问题。杠杆：对预测变量具有极高价值的观察点具有很高的杠杆作用。杠杆作用是对自变量偏离均值的程度的度量。高杠杆点可能会对回归系数的估计产生很大影响。影响：如果删除观察结果会显着改变

参与评论您还未登录，请先登录后发表或查看评论

Python实现稳健线性回归模型(rlm算法)项目实战

热门推荐

Daunxx的专栏

07-08

5万+

之前文章里的关于线性回归的模型，都是基于最小二乘法来实现的。但是，当数据样本点出现很多的异常点（outliers），这些异常点对回归模型的影响会非常的大，传统的基于最小二乘的回归方法将不适用。

稳健回归-鲁棒回归

山里娃的博客

10-28

2439

稳健回归（robust regression）是统计学稳健估计中的一种方法，其主要思路是将对异常值十分敏感的经典最小二乘回归中的目标函数进行修改。经典最小二乘回归以使误差平方和达到最小为其目标函数

线性回归之稳健回归

曼曼的博客

01-13

5431

1、什么是线性回归？ 线性回归是利用数理统计中的回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 线性回归模型： 线性回归得出的模型不一定是一条直线，在只有一个变量的时候，模型是平面中的一条直线；有两个变量的时候，模型是空间中的一个平面；有更多变量时，模型将是更高维的。 线性回归中通常使用残差平方和，即点到直线的平行于y轴的距离而不用垂线距离，残差平方和除以样本量n就是...

R数据分析实例：稳健回归

bbbeoy的专栏

05-15

1万+

按语：当数据含有离群点（Outliar）或者强影响点（influential observation）时，稳健回归（Robust Regression）会比普通最小二乘法(OLS)的表现要更优异。稳健回归也可以用来检测数据中的强影响点。提示: 本文旨在介绍与稳健回归相关的R命令，因此，并未全面覆盖稳健回归的相关知识，也不涉及数据清洗、数据检测、模型假设和模型诊断等内容。文档内容基于R 2.

回归分析法和稳健估计法在测量数据处理中对比分析.pdf

08-15

在数据分析和处理领域，回归分析法和稳健估计法是两种常见的统计方法。回归分析法是一种通过已知变量来预测未知变量的方法，其核心在于找到变量间最佳的数学关系。稳健估计法则是一种能够抵抗异常值影响的估计方法。...

matlab稳健回归分析,matlab稳健回归函数文档

weixin_42511315的博客

03-19

1506

2018-06-14 20:39:44regress函数和regstats函数利用普通最小二乘法估计模型中的参数, 参数的估计值受异常值的影响比较大. robustfit函数采用加权最小二乘法估计模型中的参数, 受异常值的影响就比较小. robustfit函数可用来作稳健的多重线性或广义线性回归分析, 下面介绍robustfit函数的用法.调用方法b = robustfit(X,y)b = rob...

03-17

MATLAB统计分析-回归分析

06-16

下面将详细讨论MATLAB中的四种主要回归分析类型：简单线性回归、多项式回归、非线性回归和稳健回归。 1. **简单线性回归**： - 简单线性回归是最基础的回归模型，涉及一个自变量和一个因变量。在MATLAB中，可以...

稳健OLS回归方法

weixin_46649908的博客

05-13

1462

稳健OLS回归方法

【转】Robust regression（稳健回归）

weixin_30677073的博客

05-19

2014

Robust regression（稳健回归）语法 b=robustfit(X,y) b=robustfit(X,y,wfun,tune) b=robustfit(X,y,wfun,tune,const) [b,stats]=robustfit(...) 描述 b=robustfit(X,y) 通过执行稳健回归来估计线性模型y=Xb，并返回一个由回归系数组成的向量b。X是一个n*p预测...

如何在 R 中执行稳健回归

Mrrunsen的博客

06-23

1178

当我们正在使用的数据集中存在异常值或有影响的观察值时，稳健回归是我们可以用作普通最小二乘回归的替代方法。为了在 R 中执行稳健的回归，我们可以使用 MASS包中的rlm()函数，它使用以下语法：以下分步示例展示了如何在 R 中为给定的数据集执行稳健的回归。第 1 步：创建数据首先，让我们创建一个假数据集来使用：接下来，让我们拟合一个普通的最小二乘回归模型并创建一个标准化残差图。在实践中，我们经常将任何绝对值大于 3 的标准化残差视为异常值从图中我们可以看到，有两个观测值的标准化残差约为 3。这表明

调用robustfit函数作稳健回归

weixin_34247155的博客

07-05

914

调用robustfit函数作稳健回归 regress函数和regstats函数利用普通最小二乘法估计模型中的参数，参数的估计值受异常值的影响比较大。robustfit函数采用加权最小二乘法估计模型中的参数，受异常值的影响就比较小。robustfit函数用来作稳健的多重线性或广义线性回归分析，下面介绍robustfit函数的用法。1.4.1．robustfit函数的用法robustfit函数有以下...

robustfith函数-最小二乘估计-M估计-Robust regression

夜空

04-25

2万+

robustfit Robust regression（稳健回归）语法 b=robustfit(X,y) b=robustfit(X,y,wfun,tune) b=robustfit(X,y,wfun,tune,const) [b,stats]=robustfit(...) 描述 b=robustfit(X,y)通过执行稳健回归来估计线性模型y=Xb，并返回一

详解线性回归分析理论与计算实践

5. 回归诊断：涵盖了残差分析、杠杆值检验、异方差性检查等工具，帮助用户确保模型的稳健性。 6. 实际应用：书中还包含了许多实际案例，展示了如何将线性回归理论应用于经济学、社会科学、工程学等各种领域的数据...

回归分析系列22— 稳健回归

23章 稳健回归

23章稳健回归