其中写了两个函数整合估计结果;
(
3
)写了一个分位数分解函数来处理
MM2005
的分解过程;(
4
)使用一个数据集进行案例分析,完整地展现了分析过程。
第一节
分位数回归介绍
(一)为什么需要分位数回归?
传统的线性回归模型描述了因变量的条件均值分布受自变量
X
的影响过程。其中,最小二乘法是估计回归系数的最基本方法。如果模型的随机误差项
来自均值为零、方差相同的分布,那么回归系数的最小二乘估计为最佳线性无偏估计(
BLUE
);如果随机误差项是正态分布,那么回归系数的最小二乘估计与
极大似然估计一致,均为最小方差无偏估计(
MVUL
)。此时它具有无偏性、有效性等优良性质。
但是在实际的经济生活中,这种假设通常不能够满足。例如当数据中存在严重的异方差,或后尾、尖峰情况时,最小二乘法的估计将不再具有上述优良
性质。为了弥补普通最小二乘法(
OLS
)在回归分析中的缺陷,
1818
年
Laplace
[2]
提出了中位数回归(最小绝对偏差估计)。在此基础上,
1978
年
Koenker
和
Bassett
[3]
把中位数回归推广到了一般的分位数回归(
Quantile Regression
)上。
分位数回归相对于最小二乘回归,应用条件更加宽松,挖掘的信息更加丰富。它依据因变量的条件分位数对自变量
X
进行回归,这样得到了所有分位
数下的回归模型。因此分位数回归相比普通的最小二乘回归,能够更加精确第描述自变量
X
对因变量
Y
的变化范围,以及条件分布形状的影响。
(二)一个简单的分位数回归模型
[4]
假设随机变量的分布函数为
(
1
)
Y
的
分位数的定义为满足
的最小
值,即
(
2
)
回归分析的基本思想就是使样本值与拟合值之间的距离最短,对于
Y
的一组随机样本
,样本均值回归是使误差平方和最小,即
(
3
)
样本中位数回归是使误差绝对值之和最小,即
(
4
)
样本分位数回归是使加权误差绝对值之和最小,即
(
5
)
上式可等价表示为:
其中,
为检查函数(
check function
),定义为: