分位数回归--基于R

分位数回归

分位数回归是估计一组回归变量X与被解释变量Y的分位数之间线性关系的建模方法。以往的回归模型实际上是研究被解释变量的条件期望。而人们也关心解释变量与被解释变量分布的中位数、分位数呈何种关系。它最早由Koenker和Bassett(1978)提出。OLS回归估计量的计算是基于最小化残差平方。分位数回归估计量的计算也是基于一种非对称形式的绝对值残差最小化。
在这里插入图片描述
当我们使用0.9分位数回归,重新得出新函数图像如左图上:
可以看到,这比起普通的回归分析,就能进一步显示出y的变化幅度其实是增大了。所谓的0.9分位数回归,就是希望回归曲线之下能够包含90%的数据点(y),这也是分位数的概念。
在这里插入图片描述
当然,我们仅仅得到0.9分位数回归曲线是不够的,进一步的我们可以画出不同的分位数回归曲线,这样才能能更加明显地反映出,随着x的增大,y的不同范围的数据是不同程度地变化的。

分位数回归优点

(1)能够更加全面的描述被解释变量条件分布的全貌,而不是仅仅分析被解释变量的条件期望(均值),也可以分析解释变量如何影响被解释变量的中位数、分位数等。不同分位数下的回归系数估计量常常不同,即解释变量对不同水平被解释变量的影响不同。
(2)中位数回归的估计方法与最小二乘法相比,估计结果对离群值则表现的更加稳健,而且,分位数回归对误差项并不要求很强的假设条件,因此对于非正态分布而言,分位数回归系数估计量则更加稳健。

案例

用的是R自带的数据集engel
library(quantreg)#使用包quantreg
data(engel)
head(engel)
income foodexp
1 420.1577 255.8394
2 541.4117 310.9587
3 901.1575 485.6800
4 639.0802 402.9974
5 750.8756 495.5608
6 945.7989 633.7978
包含自变量income ,因变量foodexp

建模使用函数rq
rq(foodexp~income,tau = 1:49/50,data=engel)
其中tau为自己设置的分位数,当设置为-1时,所有分位数的结果全部显示出来
rq1 = rq(foodexp~income,data = data,tau = -1)
summary.rq(rq1)
rq1$sol[4:5,]#4,5行是各个分位数的截距、斜率

在这里插入图片描述
在这里插入图片描述
完整代码:
先看tau取值 1:49/50
library(quantreg);data(engel)
head(engel)
plot(summary(rq(foodexp~income,tau = 1:49/50,data=engel)))

library(quantreg);data(engel)
par(mfrow=c(1,2))
plot(foodexp ~ income, data = engel, main = “eng

  • 10
    点赞
  • 78
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值