分位数回归(Quantile Regression)

在这里插入图片描述

数据采用分位数回归
在执行回归分析时,仅对问题进行数值预测还不够,您还需要表达您对该预测是否正确的信心。例如,如果您正在查看特定市场中房屋的价格,并且您的模型预测房屋的售价为262,458.45美元,那么您对模型的预测是否正确的信心如何?希望您的直觉会说这是真的,而且可能性很小,但是也许您的模型很接近实际答案。我们需要一种在一定范围内具有一定置信度,同时也能预测值范围的方法。

分位数回归。与常规线性回归不同,常规线性回归使用最小二乘法来计算不同特征值之间条件概率的均值(conditional mean),分位数回归估计条件概率的中位数(conditional median)。分位数回归是线性回归的扩展,当不满足线性回归的条件(即线性,均方差,独立性或正态性)时使用。 传统上,用于计算均值的线性回归模型采用以下形式

在这里插入图片描述

线性回归模型方程

其中p等于方程式中的特征数量,n是训练数据点的数量。最佳线性回归线是通过最小化均方误差来计算的,该均方根误差可通过以下公式找到
在这里插入图片描述

线性回归的均方误差

现在,对于分位数回归,您不仅可以找到中位数,还可以为特征中的特定值计算任何分位数(百分比)。例如,如果我们要找到特定房屋价格的第25个分位数,则意味着房屋的实际价格有25%的机会低于预测值,而价格有75%的机会高于预测值。

采用与线性回归模型相似的结构,五分位数的分位数回归模型方程为

在这里插入图片描述

分位数回归模型

这意味着β贝塔系数现在不是常数,而是与分位数相关的函数。在特定分位数下找到这些β的值类似于常规线性回归的过程,只是现在我们必须减少绝对中位差(median absolute deviation)。

在这里插入图片描述

分位数回归的绝对中位差

在此,函数𝜌是检查函数,该函数根据误差的分位数和整体符号为误差赋予不对称权重。在数学上,𝜌采用以下形式

在这里插入图片描述

检查函数方程

在这里插入图片描述

检查功能图

在这种情况下,u是单个数据点的误差,并且max函数返回括号中的最大值。这意味着如果误差为正,则检查功能将误差乘以𝜏,如果误差为负,则检查功能将误差乘以(1- 𝜏)。

例如,如果您想要第10个百分位数的中位数,则意味着您希望90%的误差为正,而10%的误差为负。为了在使该语句为真的同时找到最小的MAD,必须将权重添加到错误中。在第十个分位数的情况下,负数权重为0.9,负数为正数。

让我们看看实际的分位数回归。让我们研究QuantReg的python statsmodels示例,该示例查看1857年比利时工人阶级家庭样本中食品收入与支出之间的关系,并了解我们可以进行什么样的统计分析。
import statsmodels.api as sm
import statsmodels.formula.api as smf
data = sm.datasets.engel.load_pandas().data
data.head()

在这里插入图片描述

1857年比利时家庭数据

mod = smf.quantreg('foodexp ~ income', data)
res = mod.fit(q=.5)
print(res.summary())

在这里插入图片描述
如您所见,您可以为特定分位数创建回归线,并对其进行统计分析,方法与使用常规线性回归模型相同。

补充材料:

如何通俗地理解分位数?
https://www.zhihu.com/question/67763556

分位数回归(Quantile Regression)
https://blog.csdn.net/jesseyule/article/details/95247155

什么是“绝对中位差”(median absolute deviation)?
https://www.zhihu.com/question/56537218

【强化学习 48】Quantile Regression
https://zhuanlan.zhihu.com/p/60912847

  • 7
    点赞
  • 58
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值