分位数回归(Quantile Regression)

在介绍分位数回归之前,先重新说一下回归分析,我们之前介绍了线性回归、多项式回归等等,基本上,都是假定一个函数,然后让函数尽可能拟合训练数据,确定函数的未知参数。尽可能拟合训练数据,一般是通过最小化MSE来进行:

在这里插入图片描述

所以得到的y本质上就是一个期望。

根据上面的分析,我们可以得到一个结论,我们前面所有回归分析得到的函数,本质上就是一个条件期望函数,在x等于某个值的条件下,根据数据,求y的期望。

分位数回归提出的原因,就是因为不希望仅仅是研究y的期望,而是希望能探索y的完整分布状况,或者说可能在某些情况下我们更希望了解y的某个分位数。下面再举一个例子,说明分位数回归的作用,假如现在我们有一个如图分布的数据,对其进行普通的回归分析,得到:

从拟合的曲线我们就可以看出问题了,原数据随着x增大,y的分布范围越来越大,可是因为普通的回归分析得到的是条件期望函数,也就是y的期望,所以平均即使y的分布变化了,平均来说y还是以同样的斜率稳定上升,当我们使用0.9分位数回归,重新得出新函数图像:

这次,比起普通的回归分析,就能进一步显示出y的变化幅度其实是增大了。所谓的0.9分位数回归,就是希望回归曲线之下能够包含90%的数据点(y),这也是分位数的概念,分位数回归是把分位数的概念融入到普通的线性回归而已。

当然,我们仅仅得到0.9分位数回归曲线是不够的,进一步的我们可以画出不同的分位数回归曲线,这样才能能更加明显地反映出,随着x的增大,y的不同范围的数据是不同程度地变化的,而这个结论通过以前的回归分析是无法得到的,这就是分位数回归的作用。

我们可以最小化以下函数确定分位数:

在这里插入图片描述

本质上,这就是一个加权最小二乘法(虽然形式上有点不一样),给不同的y值(大于分位点和小于分位点的y)不同的权重,比如现在我们有一个数据集是1到10各整数,我们希望求0.7分位数,假设这个0.7分位数是q,然后所有大于q的数都被赋上权重0.7,小于q的赋予权重0.3,我们要最小化函数Q(tau)求分位数,验证一下就可以知道7就是我们要求的分位点。

接下来我想再详细比较这个求分位点的函数和之前求期望的最小二乘法,关于函数Q(tau),我们可以再改写一下:

在这里插入图片描述

写成这个形式就彻底变成我们熟悉的加权最小二乘法了,所以说本质上他们都是一样的,而且最小化这个函数同样可以求出分位点。我们以前用最小二乘法得到均方误差作为回归模型的损失函数,因而得到的结果是条件期望函数,如果我们把损失函数换成这里的加权最小二乘函数:

在这里插入图片描述

得到的结果也应该符合分位数的定义,也就是说,比如我们使tau=0.8,那么我们最小化损失函数求参数,得到的回归曲线f,应该有80%的数据在曲线的下方。

所以,分位数回归,不能说是一种回归模型,而是一类回归模型,或者说是一种改进思想,我们可以把它应用到线性回归、多项式回归、核回归等等,最根本的就是把损失函数从最小二乘法改成加权最小二乘法,通过不同的分位数得到不同的结果,再根据结果进行分析。

  • 41
    点赞
  • 193
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
1. Friedman秩和检验的原理和适用条件: - 原理:Friedman秩和检验是一种非参数方法,用于比较多个相关样本的差异。它的原理是将每个样本中的观测值按照大小进行排序,并赋予相应的秩次。然后,计算每个样本的秩和,并将其作为检验统计量。最后,通过对秩和进行排列或随机化来判断样本之间是否存在显著差异。 - 适用条件:Friedman秩和检验适用于样本之间的相关数据,且数据没有特定的分布假设。它常用于评估多个相关样本在不同条件下的差异,例如评估多个治疗方法的效果或比较同一组被试在不同时间点的表现。 2. 分位数回归quantile regression)与传统回归方法的区别: - 分位数回归分位数回归是一种非参数统计方法,用于研究自变量与因变量在不同分位数下的关系。它通过估计条件分位数函数来描述自变量对因变量分布的影响。分位数回归可以提供关于不同分位数下因变量的条件分布信息,从而更全面地理解变量之间的关系。 - 传统回归方法:传统回归方法(如最小二乘法)旨在估计因变量的平均值与自变量之间的关系。它对数据的分布做出了特定的假设,通常假设误差项服从正态分布。传统回归方法主要关注平均值附近的因果关系,可能无法捕捉到因变量在不同分位数下的变化情况。 总结:分位数回归与传统回归方法的主要区别在于分析的目标和侧重点。分位数回归可以提供更详细的条件分布信息,适用于研究因变量在不同分位数下的变化情况,而传统回归方法则更注重描述因变量的平均值与自变量之间的关系。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值